HPC в icaci.info
Като малък имах детска мечта, подобно на всички малчугани, но не исках да ставам космонавт, нито да освобождавам лигави принцеси от порутени замъци, пазени от зли дракони. Поради ранното излагане на магическата сила на компютрите и естеството на литературата, с която си запълвах свободното време, исках да имам… ГОЛЯМ СУПЕРКОМПЮТЪР (от най-големите и от най-суперските). Не че знаех какво ще го правя, или пък как ще му плащам тока, но какво друго може да се очаква от едно хлапе, което намира на тавана на къщата тонове списания “Наука и техника за младежта” (издание на ЦК на ДКМС, ако някой още си спомня значението на тези съкращения) и ги изяжда от кора до кора? Е добре, в един момент осъзнах, че притежанието на такава машина не е по силите на обикновения човек, поради което мечтата ми се измести от притежаване на към достъп до въпросния ГОЛЯМ СУПЕРКОМПЮТЪР. Отново без никаква идея, какво точно ще правя с този достъп. Обаче знаех, че искам Cray, понеже в онова списание пишеше, че Cray бил най-добрият от най-големите. Така де, най-доброто или нищо.
За разлика от мечтите за космонавстване или рицарстване, реализирането на моята се оказа не само реално възможна, но и напълно възможна реалност. С времето не само придобих [леееко нелегално в началото ;)] достъп до Cray (ако си им фен – цъкни тук), не само намерих как и за какво да ползвам суперкомпютрите (благодарение на милите хора от EPCC и разходките до китния Единбург), но и прескочих значително отвъд мечтата си, приземявайки се в позицията “направи си сам”.
Но не за реализираните детски мечти ще става дума тук, а за действителността на 2009 г. А тя е, че вече практически няма широкодостъпен микропроцесор, който да не е с поне две ядра. Апокрифните доскоро техники за паралелно програмиране, известни само на гурутата в академичните среди и производителите на “ентърпрайз” решения, вече придобиват практическа популярност. Съвременните версии на най-популярните средства за разработка на приложения (GCC и Visual Studio) поддържат OpenMP – един от стандартите за писане на паралелни приложения, непознат до скоро на широката публика, a Intel започна серия от популяризаторски вебинари (WEB семинари) за OpenMP и TBB (Threading Building Blocks) и разработи специални инструменти за улесняване на прехода от серийно към паралелно програмиране, след като се оказа, че повечето многонишкови програми никога не са били замисляни да работят в условия, в които нишките им се поемат от различни физически ядра, поради което рекламираните революционни 2x и 4x ускорения на работния процес така и не се получиха. Причината е проста – нишките се ползват основно за асинхронна обработка на събития и избягване на изчакваща синхронизация, а не за разпределяне на изчислителното натоварване. Това е подход, известен като паралелизъм по задачи, като различните задачи обаче са силно небалансирани по отношение на използването на процесорните ресурси, тъй като повечето от тях “проспиват” времевите си кванти в изчакване на вход/изход или друго синхронно събитие.
За пълното овладяване на мощта на новите многоядрени процесори е необходимо известна промяна в парадигмите на програмиране, като фокусът се измести от паралелизма по задачи към т.нар. паралелизъм по данни. За щастие това не е terra incognita, а добре разработена още от 80-те години на миналия век територия. За нещастие, повечето паралелни машини се използваха за решаване на научни и инженерни задачи, поради което основните парадигми и библиотеки за паралелно програмиране са FORTRAN и C центрични (OpenMP, MPI), като обаче постепенно се появяват и по-съвременни абстрактни приложни решения, като Intel Threading Building Blocks (C++ библиотека) и паралелните разширения на .NET (езиково неутрално решение). Също така, повечето функционални и логически езици с приложно значение, макар и все още възприемани като екзотика, като Erlang и OCaml, поддържат паралелно изпълнение по най-естествен начин.
Отдавна се каня [от години, всъщност :)] да започна да списвам по нещо за високопроизводителните изчисления, наричани в англоезичната литература HPC (High Performance Computing), но все си намирах други занимания като пълнежи на свободното ми време, а и ниският интерес към курса ни по паралелно програмиране сред възпитаниците на факултетите от комплекс Лозенец на СУ поставяше под сериозно съмнение смисъла на начинанието. Придобиването обаче от ДАИТС на 8192-ядрената Blue Gene/P машина, създаването на национален суперкомпютърен център и сродните му центрове по върхови постижения, както и масовото навлизане в родината на машини с многоядрени процесори, все пак ме карат да мисля, че интересът към тази тематика тепърва ще се формира. По случая започвам рубрика HPC, първи обитател на която ще бъде сравнение на Intel Core i7 (на ManiaX) и Intel Xeon E5420 (на ФзФ) от гледна точка на няколко типични научни приложения.