Вопросы оптимизации кода [обсуждение темы БП]

Тема открыта по просьбе жителей Королевства и посвящена обсуждению вопросов оптимизации кода. Выставляйте свои лучшие и худшие тексты и не стесняйтесь их обсуждать. В споре рождается истина. Или, по крайней мере, оптимизация.

Всего в теме 737 сообщений

Добавить свое сообщение

Отслеживать это обсуждение

Смотрите также обсуждения:

Тестирование проекта. Отладка.: Подводные камни
Централизованная обработка ошибок
Бета-тестирование
Давайте учиться на ошибках.
Почему программисты допускают ошибки?
Автоматизированные тесты для GUI
О системах контроля ошибок

<<<... | 87—38 | 37—1

Всего сообщений в теме: 737; страниц: 15; текущая страница: 15

№ 37 15-06-2005 06:31

Я эту задачку привел из-за решения. Потому что этот подход может использоваться и в других задачах. Как минимум знаю еще два случая, когда для решения задач использовался аналогичный подход. Один случай у меня лично :-)

Geo

№ 36 15-06-2005 06:24

Ответ на »сообщение 35« (Мухтар)
___________________________

Тут спорить не о чем, для ultimate быстродействия лучше таблиц ничего не придумали. Приведенный мной код оптимален по двум критериям, но не является наилучшим по каждому в отдельности.

Александр Малыгин

№ 35 15-06-2005 06:06

Ответ на »сообщение 34« (Александр Малыгин)
___________________________
На моем процессоре, все-таки, вариант

mov al,value
lea ebx,table
xlat [ebx]

Примерно в два раза быстрее вашего. Хотя и идет обращение к памяти... Видимо, сказывается кэш процессора

Мухтар

№ 34 15-06-2005 04:58

Ответ на »сообщение 33« (Geo)
___________________________

Есть еще одно решение этой задачи, "широко известное в узких кругах". Мой перевод с сишного исходника, найденного в инете:

function BitCount(V : byte) : byte; assembler;
asm
// v = (v & 0x55) + ((v >> 1) & 0x55);
mov dl, al
and al, $55
shr dl, 1
and dl, $55
add al, dl
// v = (v & 0x33) + ((v >> 2) & 0x33);
mov dl, al
and al, $33
shr dl, 2
and dl, $33
add al, dl
// return (v & 0x0f) + ((v >> 4) & 0x0f);
mov dl, al
and al, $0F
shr dl, 4
and dl, $0F
add al, dl
end;

Как видно, особенность в том, что отсутствует цикл как таковой, поэтому эта версия оптимальна как по памяти, так и по скорости. Процессор линейные алгоритмы выполняет быстрее разветвленных и циклических.

Александр Малыгин

№ 33 14-06-2005 13:17

Пардон за введение общественности в заблуждение. Я в спешке пропустил в своем примере самый важный оператор

function CalcBits(N : Byte) : Byte;
asm
xor ax,ax
or ah,N
jz @quit
@next:
adc al,0
shl ah,1
jnz @next
adc al,0
@quit:
end;

Здесь один лишний вызов команды adc al,0 Зато на этом деле я сэкономил один переход. Что выгоднее наизусть не помню. А лезть в справочник лениво.

Geo

№ 32 14-06-2005 12:34

Ответ на »сообщение 30« (Мухтар)
___________________________
Понял, согласен.

CoreWars

№ 31 14-06-2005 12:25

У вас где-то команда сдвига потерялась :)
Но можно второй вариант еще улучшить. См. мой пост ниже.

CoreWars

№ 30 14-06-2005 12:22

Ответ на »сообщение 25« (CoreWars)
___________________________
У вас вызов процедуры превращается в пару лишних обращений к памяти, плюс в стек идет адрес возврата, у меня лишь одно обращение - напрямую к переменной в которой хранятся исходные данные

Мухтар

№ 29 14-06-2005 12:21

Ответ на »сообщение 26« (Сергей Перовский)
___________________________
Прошу прощения, я забыл, что b в квадратных скобках означает переход на болд.
Вот и получилось вместо b-го элемента массива A, переход на жирный шрифт.

Сергей Перовский

№ 28 14-06-2005 12:20

В данном случае размер элемента массива байт (самое большое число единиц = 8) и умножения не требуется. Так что оптимальнее с массивом (одно сложение номера элемента массива с адресом его начала).
Далее, вариант Мухтара (неработающий) выполняет тело цикла ВСЕГДА 8 раз. Есть алгоритм, который позволяет выполнить тело цикла столько раз, сколько единиц в исходном числе.
Если кто знает, пусть пока не говорит, дадим время подумать? :))

CoreWars

№ 27 14-06-2005 12:17

Все правильно. Самый быстрый способ -- хранить таблицу из 256 значений, каждый элемент которой содержит количество установленных бит в его индексе. А таблицу задать в виде константы. Я специально подчеркивал, что другие критерии оптимизации (в том числе, объем занимаемой памяти) роли не играют. В общем, здесь даже ассемблер не нужен. Можно написать прямо на Паскале:

const
Bits : array[0..255] of Byte = (0,1,1,2,1,2,..);

function CalcBits(N : Byte) : Byte;
begin
Result:=Bits[N];
end;

А в ассемблерном варианте у меня получилось что-то вроде такого:

function CalcBits(N : Byte) : Byte;
asm
xor ax,ax
or ah,N
jz @quit
@next:
adc al,0
jnz @next
adc al,0
@quit:
end;

Кстати, задача и решеие из реальной практики фирмы, разрабатывающей OCR-системы.

Geo

№ 26 14-06-2005 12:15

Ответ на »сообщение 14« (Geo)
___________________________
Считается, что самым быстрым будет вариант с хранением заранее подсчитанных результатов в массиве.
Действительно, очень красиво - Result:=A и все.
Но что такое обращение к элементу массива?
Это прежде всего вычисление смещения относительно начала массива. Транслятор превратит это в умножение индекса на длину элемента массива. А умножение - операция медленная. Решение от Мухтара может оказаться быстрее.
Чтобы гарантировать выигрыш от хранения результатов, нужно избавиться от индекса:
Result:=Byte(pointer(inc(Longint(@A),b))^);
Эффективно, но очень заумно.

Сергей Перовский

№ 25 14-06-2005 12:14

Ох, ну давайте сравнивать: у меня 18 байт у вас - 20. Т.к. для 32х битных процессоров 16и битные команды длиннее. Или вы имели в виду скорость выполнения?
Про стек не понял: это вы про lea? В данном случае это же сложение не затрагивающее флаги!

CoreWars

№ 24 14-06-2005 12:08

Ответ на »сообщение 20« (CoreWars)
___________________________
Со стеком, плюс вес инструкций больше

Мухтар

№ 23 14-06-2005 12:08

Кстати, задача: можно ли отсортировать массив за один проход? Иначе говоря каждый элемент должен считываться только один раз (и записываться соответсвенно тоже). Дополнительный массив не предлагать.

CoreWars

№ 22 14-06-2005 12:05

Ответ на »сообщение 20« (CoreWars)
___________________________
У вас слишком много обращений к памяти

Мухтар

№ 21 14-06-2005 12:05

В любом случае, подобные задачи не являются тестом на способность находить оптимальное решение. Если знаешь - напишешь. Не знаешь - за несколько часов явно не сможешь додуматься до алгоритма, который улучшали несколько лет.

CoreWars

№ 20 14-06-2005 11:53

Если брать ваш вариант (жутко неоптимальный, кстати), то получится что-то подобное:

function Bits(value: byte): int;
asm
xor ecx, ecx
test al, al
jz @quit
@noinc:
shl al, 1
jnc @noinc
lea ecx, [ecx + 1]
jnz @noinc
@quit:
mov eax, ecx
end;

CoreWars

№ 19 14-06-2005 11:51

Ответ на »сообщение 18« (CoreWars)
___________________________

Да, лажа. Но смысл понятен...

Мухтар

№ 18 14-06-2005 11:47

Да, в памяти. Оптимизация по скорости потому что.
У вас, кстати, ошибка. Считает неправильно. В 5 нашел 3 единицы, в 3 - 1.

CoreWars

№ 17 14-06-2005 11:37

Ответ на »сообщение 16« (CoreWars)
___________________________

Самое быстрое брать ответ из таблицы (256 значений). Если нельзя использовать заранее вычисленные данные, то вычитанием и AND'ом.

Ага, а таблица в памяти хранится...

Мухтар

№ 16 14-06-2005 11:34

Самое быстрое брать ответ из таблицы (256 значений). Если нельзя использовать заранее вычисленные данные, то вычитанием и AND'ом.

CoreWars

№ 15 14-06-2005 11:28

Ответ на »сообщение 14« (Geo)
___________________________
На оптимальность не претендую. Итак, вариант №1:

inline unsigned short BitsCounter(unsigned char value)
{
_asm {
mov al,value
xor cx,cx
noinc:
shl al,1
jz quit
jno noinc
inc cx
jmp noinc
quit:
mov ax,cx
}
}

Мухтар

№ 14 14-06-2005 11:10

Ответ на »сообщение 13« (Сергей Перовский)
___________________________
Самое смешное, что наилучшее решение не зависит от процессора и является наилучшим независимо ни от чего. Честно говоря, я (когда мне эту задачу задали) до самого карсивого решения не догадался. Я тоже думал о сдвгах через CF и сложеннии с CF.

В принципе, я могу решение привести, если никто не хочет поизвращаться. Так что, как скажете.

Подсказка: "Требуется максимальная оптимизация по быстродействию. Остальные критерии несущественны".

Geo

№ 13 14-06-2005 10:45

Ответ на »сообщение 12« (Geo)
___________________________
Задача отличная. Забавно, что и тут однозначного ответа нет - на разных процессорах оптимальными по быстродействию окажутся принципиально разные алгоритмы. Дело в соотношении длительности умножения и простых операций - сложений, сдвигов и т.д.

Сергей Перовский

№ 12 14-06-2005 08:35

Кстати, поситал вот сообщения и вспомнил прикольную задачку на оптимизацию.

Нужно написать функцию, которая бы получала на вход байт, а возвращала бы количество битов в этом байте, установленных в 1. Требуется максимальная оптимизация по быстродействию. Остальные критерии несущественны.

Geo

№ 11 14-06-2005 06:04

Оптимизация предусматривает наличие критерия.
Привычными для программистов являются оптимизация по памяти и по скорости. А какие еще встречаются критерии?
Мне приходит в голову оптимизация по простоте использования, по надежности, по скорости разработки, по простоте модификации.Дополнения принимаются.
Таким образом мы имеем дело с многокритериальной оптимизацией. Для нее существует понятие множества Паретто. Это множество решений, для которых для любой пары решений не существует предпочтения по всем критериям одновременно. Если по каким-то критериям лучше A то по другим B.
Не вошедшие в множество Паретто варианты не являются лучшими ни в каком смысле.
К сожалению в случае программ множество Паретто очень велико т.к. критерии сильно противоречат друг другу.
Попробуем с этой точки зрения рассмотреть применение СУБД для небольших объемов данных.
По быстродействию и (редкий случай совпадения) по используемой памяти впереди списки объектов. По скорости разработки и легкости модификации впереди "карманные" СУБД.
Выбирай, но осторожно, но выбирай: или вчера большие но по пять, или сегодня по три но маленькие (с).

Сергей Перовский

№ 10 14-06-2005 02:25

Ответ на »сообщение 8« (sega-zero)
___________________________

А что? В Longhorn вроде обещали нечто подобное - файловая система на основе БД. Правда, скорее всего именно так писАться и не будет, опять тот же апи...

WinFS уже вывели из состава Longhorn

Max Belugin

№ 9 12-06-2005 14:21

"В споре рождается истина."
Истина в споре не рождается. В споре рождаются синяки. А если серьезно, то это выражение звучит примерно так: "В споре рождается сомнение, а сомнение - первый шаг на пути к истине".

Guest

№ 8 12-06-2005 14:06

А что? В Longhorn вроде обещали нечто подобное - файловая система на основе БД. Правда, скорее всего именно так писАться и не будет, опять тот же апи...

Sega-Zero

№ 7 12-06-2005 07:49

Согласен, базами данных сейчас, пожалуй, можно называть только SQL-серверные системы.

Я не понимаю, почему вообще SQL-сервер не является частью операционной системы. Чтобы было можно писать

select * from 'C\windows\*.txt' where charindex('бла-бла') <> 0

Наверное, опять коммерческие штучки, без SQL можно работать, а вот без Explorer и MediaPalyer ну никак, не может kernel без музыки :)

kkk

№ 6 12-06-2005 02:14

Ответ на »сообщение 5« (bantik)
___________________________
Если все данные можно целиком загрузить в оперативную память, то возражений нет. Только непонятно, зачем это называть "База данных". Ведь этот термин уже закреплен за определенным понятием. Если же при обработке требуется подкачка с диска, то никакая CSV база данных по скорости не сравнится с нормальной реляционной базой данных.

Geo

№ 5 12-06-2005 01:42

Ты будешь смеяться, но CSV базы данных еще очень даже востребованы. Большинство систем реального времени - DSS или какие-нибудь процессинги до сих пор не работают на SQL , а используют базу попроще - вплоть до текстовых файлов. ЗА счет этого получается потрясающая скорость работы..
А надежность можно обеспечить и аппаратными средствами.

bantik

№ 4 10-06-2005 19:18

Ответ на »сообщение 3« (raic)
___________________________

Можна использовать готовое решение - заменить большие
масиви и списки (TList) на TTable. Решается 2 проблеми - нехватка памяти и бистродействие.
Проблема быстродействия не решается, так как работа с таблицей медленнее, чем работа со списком. Так что решение касается только нехватки памяти.

Кстати, если уж на то пошло, то изначально ьазы данных возникли именно для оптимизации по времени дисковых операций в случае, когда объемы данных большие и не помещаются целиком в оперативную память. Именно на таком пониманиии баз данных я и вырос. Посему сейчас просто зверею, когда к базам данных относят Access (в котором оптимизацией быстродействия и не пахнет). Или еще более крутой пример: база данных в формате CSV! Это ж надо!!! В свое время ушли от произвольных файлов данных к структурированным, чтобы оптимизировать поиск в файле. И назвали это базами данных. Сейчас понятие базы данных расширеям на файлы произвольной структуры (да еще и с записью чисел в виде строк текста). От чего ушли, к тому и вернулись. Зачем же были эти 10-15 базданческих лет. Можно было не дергаться со всякими DBase, подождать лет 10 и потребность в нем сама бы отпала :-)

Geo

№ 3 10-06-2005 16:20

Можна использовать готовое решение - заменить большие
масиви и списки (TList) на TTable. Решается 2 проблеми - нехватка памяти и бистродействие.

raic

№ 2 10-06-2005 16:05

Ответ на »сообщение 1« (Green)
___________________________

Предлагаю оптимизировать код через меню "Проект-Опции", на закладке "Компилятор" включить чекбокс "Оптимизация".
А что это дает? Кстати, если кто знает, то поделитесь плиз. Самому исследовать что-то ломает. Мне что-то кажется, что при этом некоторые локальные переменные не создаются, а соответствующие значения хранятся в регистрах процессора.

Geo

№ 1 10-06-2005 15:48

Предлагаю оптимизировать код через меню "Проект-Опции", на закладке "Компилятор" включить чекбокс "Оптимизация".

Green

<<<... | 87—38 | 37—1

Всего сообщений в теме: 737; страниц: 15; текущая страница: 15

Добавить свое сообщение

Отслеживать это обсуждение

Дополнительная навигация:

Если вы заметили орфографическую ошибку на этой странице, просто выделите ошибку мышью и нажмите Ctrl+Enter.
Функция может не работать в некоторых версиях броузеров.

	"Knowledge itself is power" F.Bacon
Поиск \| Карта сайта \| Помощь \| О проекте \| ТТХ