InterBase и FireBird: вопросы по работе и их решение - [54] :: Прикладное программирование

Если я правильно понял ekemov, то он действительно прав, так как про оператор IN, я не стал сразу разжевывать. Предлагаю посчитать затраты на ресторацию стандартного порядка возвращаемых оператором IN записей. При моём последовательном чтении нам кажется что сервер вернёт отсортированные айдишники, а не тот порядок который указан в скобках - иногда это не удобно. По этой причине посчитаем затраты на ресторацию этого порядка от самого лёгкого случая до самого тяжелого.
1) Случай когда в запросе уже есть ORDERBY нам не следует вообще делать ресторацию. Тут всё ясно.
2) Случай когда последовательное чтение идёт именно по айдишникам, то есть по уникальному индексу. Это случай когда для ресторации требуется ещё один массив - буфер выборки равный по количеству элементов массиву который в скобках. Когда запись является отобранной она должна ложится на против своего значения. Это IndexOf для каждой записи - то есть наносекунды. Это более 90% случаев использования IN. Из этих 90% половина содержит ORDERBY.
3) Случай. Во первых он отличается тем что количество элементов IN более 2500. Это значит в скобках будет хранимая процедура, иначе вам не передать такое количество элементов в запрос. Мы будем передавать 60 тысяч элементов через селект из хранимой процедуры. Естественно, в нашем случае сервер обязан сделать фечьол хранимой процедуры чтобы выяснить мин-макс элементы, далее всё ничем не отличается. Но в нашем случае мы последовательно читаем по не уникальному индексу. Следовательно тот буфер выборки отличается по размеру от того что возвращает селект хранимой процедуры. Следовательно ресторация обязана использовать сортированную вставку. При сортированной вставке используется операция сравнения. Эта операция похожа на переделанный IndexOf. Он должен вернуть один из двух элементов который встретится первым, он и будет минимальным. Сама эта процедура занимает наносекунды, но весь процесс сортированной вставки может занять время равное 1/24. Человеческий глаз замечает 24 кадра в секунду, 1/24 это 42 миллисекунды на ресторацию.

Я хочу рассмотреть последний случай - без сортировки по неуникальному индексу для значений которые имеют тип строка. Мы выбираем 60 тысяч записей в 5и милионной таблице. Мои затраты на всё это хозяйство занимают примерно 100 миллисекунд. Это два кадра для человеческого глаза. Современные затраты сервера в среднем превысят 5 минут (не проверял, ИМХО за это не бейте, боюсь что может быть и дольше). Для людей чувствительных ко времени вполне видна разница, нечуствительные могут продолжать наслаждаться тормозами. Теперь:

Цитата:

Просто иногда необходимо просмотреть данные в базе.

Да это один из случаев когда я использую оператор IN.

Второй случай, например, моя таблица имеет 5 миллионов документов. В программе пользователь видит только документы за последний год, почти всегда. Чутьё мне подсказывает что айдишники этих документов генерятся последовательно - в основном. Моя задача только в том, что если пользователь нажал CTRL+A и выделил все документы, а потом исключил из выборки те которые не стоят на учёте. То моя задача показать общую сумму по всем документам. Для этого я делаю в запросе оператор IN. По моей схеме пользователь даже не заметит что сумму считает не моё приложение, а сам сервер. В нынешнем случае, если сервер будет делать эту операцию то пользователь будет психовать каждый день. И так мои 100 миллисикунд против сегодняшних 5 минут на каждый чих...

Было бы приятно, если бы сервер умел и это тоже делать.

Модерирует : ShIvADeSt
Версия для печати • Подписаться • Добавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104