Статистика лингвистического анализа библиотеки и средние значения всех книг
Анализ проводился только над русскоязычными текстами. Минимальный размер обрабатываемой fb2 книги - 50 Кб. За одну страницу принято среднее значение в 1800 символов. Уникальные слова - это все встреченные уникальные слова при разборе (включая слова с ошибками, в разных склонениях, придуманные слова и имена и т.д.)
Суммарные данные анализа:
Всего обработано | 468650 книг |
Суммарная длинна текстов | 189,154,495,819 знаков |
Суммарная длинна диалогов | 51,485,731,777 знаков |
Суммарное количество слов | 28,382,535,497 слов |
Всего страниц | 105,320,137 страниц |
Всего предложений | 2,525,688,254 предложений |
Средние данные книг:
Средняя длинна текста | 403616 знаков |
Средняя длинна диалогов | 109860 знаков |
Среднее количество слов в произведении | 60562 слов |
Среднее количество страниц в произведении | 225 страниц |
Средняя длина слова | 5.30 знаков |
Среднее количество предложений в произведении | 5389 предложений |
Средняя длина предложения | 80 знаков |
Средняя доля диалогов в тексте | 26 % |
Средняя доля авторского текста | 74 % |
СДП диалогов | 69 знаков |
СДП авторского текста | 96 знаков |
Средний активный словарный запас
Всего использовано уникальных слов | 18,478,347 слов |
Средний активный авторский словарный запас (САСЗ) | 12831 |
Средний активный авторский не словарный запас (САНСЗ) | 468 |
Удельный САСЗ на 3000 слов текста | 1488 |
Удельный САСЗ на 10000 слов текста | 3860 |
Удельный САСЗ на 100000 слов текста | 20926 |
Статистика букв и знаков препинания
Всего букв | 149,838,905,221 букв |
Всего знаков препинания | 6,577,392,290 знаков |
Знак | Суммарное количество (шт.) | Суммарное среднее количество на 1000 слов (шт.) |
, запятая | 3,204,428,389 | 112.81 |
. точка | 2,236,330,906 | 80.22 |
- тире | 376,031,022 | 14.19 |
? вопросительный знак | 247,865,537 | 9.24 |
! восклицательный знак | 173,494,866 | 7.02 |
... многоточие | 19,796,725 | 0.86 |
!.. восклицательный знак с многоточием | 4,951,643 | 0.21 |
?.. вопросительный знак с многоточием | 3,880,952 | 0.15 |
!!! тройной восклицательный знак | 1,525,531 | 0.08 |
?! вопросительный знак с восклицанием | 9,009,444 | 0.39 |
" кавычка | 36,832,428 | 1.5 |
() скобки | 60,090,556 | 2.16 |
: двоеточие | 139,783,922 | 5.29 |
; точка с запятой | 63,370,431 | 2.22 |
Буква | Всего (шт.) | Средняя частота использования (в %) |
А | 12,198,156,974 | 8.2 |
Б | 2,510,892,486 | 1.68 |
В | 6,618,228,264 | 4.38 |
Г | 2,583,926,642 | 1.71 |
Д | 4,521,528,030 | 3.02 |
Е-Ё | 12,593,101,672 | 8.39 |
Ж | 2,583,926,642 | 1.71 |
З | 2,518,974,522 | 1.69 |
И-Й | 12,090,377,209 | 7.98 |
К | 5,055,197,783 | 3.41 |
Л | 7,168,395,141 | 4.8 |
М | 4,848,732,112 | 3.23 |
Н | 9,914,240,911 | 6.58 |
О | 16,540,281,353 | 10.98 |
П | 4,226,238,330 | 2.81 |
Р | 6,810,208,674 | 4.5 |
С | 8,065,928,193 | 5.35 |
Т | 9,260,890,900 | 6.2 |
У | 4,171,534,716 | 2.82 |
Ф | 292,118,018 | 0.19 |
Х | 1,363,622,585 | 0.9 |
Ц | 592,678,282 | 0.39 |
Ч | 2,191,367,380 | 1.48 |
Ш | 1,222,605,038 | 0.83 |
Щ | 539,517,807 | 0.35 |
Ь-Ъ | 2,941,384,782 | 1.99 |
Ы | 2,816,563,590 | 1.89 |
Э | 516,476,676 | 0.34 |
Ю | 921,095,877 | 0.62 |
Я | 3,217,906,985 | 2.16 |
 |
Сумма частей речи
Часть речи | Всего в текстах (шт.) | средний % в текстах |
Существительное | 7,773,385,975 | 23.17 |
Глагол | 2,690,590,545 | 20.7 |
Местоимение-существительное | 2,690,590,545 | 15.72 |
Предлог | 2,061,305,641 | 10.35 |
Союз | 2,458,028,147 | 8 |
Прилагательное | 2,061,305,641 | 5.95 |
Наречие | 1,670,816,246 | 5.68 |
Местоимение-прилагательное | 1,258,001,824 | 4.16 |
Частица | 1,303,020,198 | 3.77 |
Местоименное наречие | 457,073,252 | 1.39 |
Числительное | 162,557,729 | 0.53 |
Числительное-прилагательное | 66,312,714 | 0.16 |
Междометие | 28,435,164 | 0.04 |
Часть композита - сложного слова | 4,661,747 | 0.01 |
Последние комментарии
2 часов 55 минут назад
13 часов 46 минут назад
1 день 7 часов назад
1 день 7 часов назад
1 день 7 часов назад
1 день 8 часов назад
1 день 7 часов назад
1 день 8 часов назад
1 день 8 часов назад
1 день 8 часов назад