Теория и практика параллельных вычислений

       

Результаты вычислительных экспериментов


Вычислительные эксперименты для оценки эффективности параллельного варианта метода Гаусса для решения систем линейных уравнений проводились при условиях, указанных в п. 6.5.5, и состоят в следующем.

Эксперименты производились на вычислительном кластере Нижегородского университета на базе процессоров Intel Xeon 4 EM64T, 3000 МГц и сети Gigabit Ethernet под управлением операционной системы Microsoft Windows Server 2003 Standard x64 Edition и системы управления кластером Microsoft Compute Cluster Server (см. п. 1.2.3).

Для оценки длительности ? базовой скалярной операции проводилось решение системы линейных уравнений при помощи последовательного алгоритма и полученное таким образом время вычислений делилось на общее количество выполненных операций – в результате подобных экспериментов для величины ? было получено значение 4,7 нсек. Эксперименты, выполненные для определения параметров сети передачи данных, показали значения латентности a и пропускной способности b соответственно 47 мкс и 53,29 Мбайт/с. Все вычисления производились над числовыми значениями типа double, т.е. величина w равна 8 байт.

Результаты вычислительных экспериментов приведены в таблице 8.1. Эксперименты выполнялись с использованием двух, четырех и восьми процессоров.

Таблица 8.1. Результаты вычислительных экспериментов для параллельного алгоритма Гаусса

Размер матрицыПоследовательный алгоритмПараллельный алгоритм2 процессора4 процессора8 процессоровВремяУскорениеВремяУскорениеВремяУскорение
5000,360,33021,09010,51700,69630,75040,4796
10003,3131,59502,07701,61522,05111,87151,7701
150011,4374,17882,73683,88022,94743,75673,0443
200026,6889,34322,85637,25903,67657,37133,6204
250050,12516,98602,950911,99574,178511,65304,3014
300085,48528,49483,000019,12554,469617,68644,8333


Рис. 8.3.  Зависимость ускорения от количества процессоров при выполнении параллельного алгоритма Гаусса для разных размеров систем линейных уравнений

Сравнение времени выполнения эксперимента и теоретической оценки Tp из (8.5) приведено в таблице 8.2 и на рис. 8.4.


Вычислительные эксперименты для оценки эффективности параллельного варианта метода сопряженных градиентов для решения систем линейных уравнений проводились при условиях, указанных в п. 8.2.7.

Результаты вычислительных экспериментов приведены в таблице 8.3. Эксперименты проводились на вычислительных системах, состоящих из двух, четырех и восьми процессоров.

Таблица 8.3. Результаты вычислительных экспериментов для параллельного метода сопряженных градиентов для решения систем линейных уравнений

Размер матрицыПоследовательный алгоритмПараллельный алгоритм2 процессора4 процессора8 процессоровВремяУскорениеВремяУскорениеВремяУскорение
5000,50,46341,07870,47061,06231,30200,3840
10008,143,92072,07613,63542,23903,50922,3195
150031,39117,95051,748714,41022,178320,20011,5539
200092,3651,32041,799640,74512,266737,93192,4348
2500170,549125,30051,361185,07612,004687,26261,9544
3000363,476223,33641,6274146,13082,4873134,13592,7097


Рис. 8.6.  Зависимость ускорения от количества процессоров при выполнении параллельного метода сопряженных градиентов для решения систем линейных уравнений

Сравнение времени выполнения эксперимента и теоретической оценки Tp из (8.13) приведено в таблице 8.4 и на рис. 8.7.

Таблица 8.2. Сравнение экспериментального и теоретического времени выполнения параллельного метода сопряженных градиентов раешения системы линейных уравнений

Размер матрицы2 процессора4 процессора8 процессоров
5001,30420,46340,66070,47060,33901,3020
100010,37133,92075,21943,63542,64353,5092
34,933317,950517,542414,41028,847020,2001
200082,722051,320441,495440,745120,882237,9319
2500161,4695125,300580,944685,076140,682387,2626
3000278,9077223,3364139,7560146,130870,1801134,1359


Рис. 8.7.  График зависимости экспериментального и теоретического времени проведения эксперимента на четырех процессорах от объема исходных данных



Содержание раздела