DeepEdit!

Программирование баз данных на Oracle, техническая документация, литература, статьи и публикации

  • Увеличить размер шрифта
  • Размер шрифта по умолчанию
  • Уменьшить размер шрифта

Сколько требуется статистики?

ЕСЛИ 

оценивать 

статистику объектов, исходя из размеров выборки, необходи­мо иметь уверенность, что эта выборка адекватна. Таким образом статистика бу­дет достаточно убедительна и обеспечит требующуюся точность. Размер выборки является важным для статистики, потому что именно он обеспечивает статистикой с хорошим доверительным интервалом и с высокой
статистической релевантностью. Доверительный интервал - это термин, испо­льзуемый для определения уровня доверия, который можно испытывать к точ­ности той или иной статистики. Доверительный интервал связан с размером
выборки.
Размер выборки в 20% от полного объема данных многократно использовал­ся для операций 

оценки 

и представляется вполне адекватным. Но встречаются
приложения, где необходим больший размер выборки. Точные и твердые пра­вила определения размера выборки отсутствуют. Необходимо определить, что является оптимальным минимальным размером выборки, который удовлетво­рит потребностям приложения и среды базы данных. 
Но для сред, имеющих дело с очень большими таблицами, или в том случае, если стоимость ресурсов и времени, которые не­обходимо затратить на 

вычисление 

статистики, оказывается слишком высокой, вполне надежным может считаться и получение 

оценки 

статистики. Для того чтобы определить, походит вам или нет 

вычисление 

статистики, используйте собственное мнение, которое должно основываться на размере объектов, допу­стимом времени простоя системы и т. п. Кроме того, если приходится работать с версией OracleSi, пакет DBMS STATS позволяет анализировать таблицы в па­раллельном режиме, что заметно сокращает время 

вычислений.


Замечание
Необходимо знать, что выполнение команды analyze с опцией estimate при размере выборки, превышающем 49%, приводит к выполнению для этой таблицы опции compute.

Замечание
Иногда встречаются приложения, для которые (при некоторые уникальных распределениях данных) увеличение значения
sample для операции estimate может привести к существенно лучшим планам выполнения и, следовательно, к более высокой производительности. Однако при увеличении значения sample не следует забывать о предыдущем замечании.


 


жалюзи на пластиковые окна.







jAntivirus