Оберон-технология: особенности и перспективы |
Тематика обсуждения: Оберон-технология. Особенности, перспективы, практическое применение.
Всего в теме 6256 сообщений
Добавить свое сообщение
Отслеживать это обсуждение Обсуждение из раздела Школа ОБЕРОНА
№ 6196 24-12-2007 09:06 | |
Ответ на »сообщение 6189« (Сергей Осколков)
___________________________
Я в этом очень слабо разбираюсь, но м.б. это связано с тем, что компилятор может выполнять операции с floating-point числами через инструкции SSE2, SIMD и т.п.
Компилятор этого и не скрывает :)
whetstone.c(182): (col. 2) remark: BLOCK WAS VECTORIZED.
№ 6195 24-12-2007 08:37 | |
Ответ на »сообщение 6191« (AVC)
___________________________
Там у нх, как я понял, есть и автоматическое распараллеливание вычислений циклов, если это возможно
Это да (хотя этот трюк уже не так нов), но чудесные цифры Intel C++ выдает и на одном-единственном ядре.
Да даже если и одно ядро -- оно же суперскалярное, несколько инструкций параллельно выполнять может...
№ 6194 24-12-2007 05:25 | |
№ 6193 24-12-2007 05:05 | |
Ответ на »сообщение 6191« (AVC)
___________________________
но чудесные цифры Intel C++ выдает и на одном-единственном ядре.
Ну тогда наверное надежней всего было бы если бы кто-нибудь разобрался в их сгенерированном ассемблерном коде. :)
№ 6192 24-12-2007 05:03 | |
10 инструкций за такт
Конечно использование SSE должно бы дать выигрыш не в 10 раз.
№ 6191 24-12-2007 05:02 | |
Ответ на »сообщение 6189« (Сергей Осколков)
___________________________
Я в этом очень слабо разбираюсь, но м.б. это связано с тем, что компилятор может выполнять операции с floating-point числами через инструкции SSE2, SIMD и т.п. Правда это вроде бы есть и в последних версиях gcc. Вот кстати про оптимизации в Интеловском компиляторе
http://www.intel.com/cd/software/products/emea/rus/download/eval/266992.htm
Да, я тоже вчера набрел на эту страницу.
В этом стоит разобраться.
Какие именно инструкции могут использоваться для параллельных вычислений?
На первый взгляд, у Интела используются обычные инструкции сопроцессора.
Там у них, как я понял, есть и автоматическое распараллеливание вычислений циклов, если это возможно
Это да (хотя этот трюк уже не так нов), но чудесные цифры Intel C++ выдает и на одном-единственном ядре.
№ 6190 24-12-2007 04:59 | |
№ 6189 24-12-2007 04:44 | |
Я в этом очень слабо разбираюсь, но м.б. это связано с тем, что компилятор может выполнять операции с floating-point числами через инструкции SSE2, SIMD и т.п. Правда это вроде бы есть и в последних версиях gcc. Вот кстати про оптимизации в Интеловском компиляторе
http://www.intel.com/cd/software/products/emea/rus/download/eval/266992.htm
Там у них, как я понял, есть и автоматическое распараллеливание вычислений циклов, если это возможно
Auto Parallelization improves application performance on multiprocessor systems by means of automatic threading of loops. This option detects parallel loops capable of being executed safely in parallel and automatically generates multi-threaded code.
№ 6188 24-12-2007 04:32 | |
№ 6187 24-12-2007 00:44 | |
Ответ на »сообщение 6186« (AVC)
___________________________
>>> и даже 20000 MIPS!
Это что же по 10 инструкций за такт?
Добавить свое сообщение
Отслеживать это обсуждение
Дополнительная навигация: |
|