Статистика лингвистического анализа библиотеки и средние значения всех книг
Анализ проводился только над русскоязычными текстами. Минимальный размер обрабатываемой fb2 книги - 50 Кб. За одну страницу принято среднее значение в 1800 символов. Уникальные слова - это все встреченные уникальные слова при разборе (включая слова с ошибками, в разных склонениях, придуманные слова и имена и т.д.)
Суммарные данные анализа:
Всего обработано | 513927 книг |
Суммарная длинна текстов | 207,378,184,009 знаков |
Суммарная длинна диалогов | 57,188,062,880 знаков |
Суммарное количество слов | 31,155,275,210 слов |
Всего страниц | 115,466,943 страниц |
Всего предложений | 2,793,859,159 предложений |
Средние данные книг:
Средняя длинна текста | 403517 знаков |
Средняя длинна диалогов | 111277 знаков |
Среднее количество слов в произведении | 60622 слов |
Среднее количество страниц в произведении | 225 страниц |
Средняя длина слова | 5.29 знаков |
Среднее количество предложений в произведении | 5436 предложений |
Средняя длина предложения | 80 знаков |
Средняя доля диалогов в тексте | 27 % |
Средняя доля авторского текста | 73 % |
СДП диалогов | 69 знаков |
СДП авторского текста | 96 знаков |
Средний активный словарный запас
Всего использовано уникальных слов | 2,234,302 слов |
Средний активный авторский словарный запас (САСЗ) | 12826 |
Средний активный авторский не словарный запас (САНСЗ) | 463 |
Удельный САСЗ на 3000 слов текста | 1488 |
Удельный САСЗ на 10000 слов текста | 3857 |
Удельный САСЗ на 100000 слов текста | 20887 |
Статистика букв и знаков препинания
Всего букв | 164,285,196,017 букв |
Всего знаков препинания | 7,212,834,220 знаков |
Знак | Суммарное количество (шт.) | Суммарное среднее количество на 1000 слов (шт.) |
, запятая | 3,512,302,793 | 112.59 |
. точка | 2,462,461,690 | 80.41 |
- тире | 410,616,706 | 14.05 |
? вопросительный знак | 274,090,625 | 9.27 |
! восклицательный знак | 191,027,446 | 7.01 |
... многоточие | 21,152,509 | 0.83 |
!.. восклицательный знак с многоточием | 5,258,182 | 0.2 |
?.. вопросительный знак с многоточием | 4,197,960 | 0.15 |
!!! тройной восклицательный знак | 1,716,111 | 0.08 |
?! вопросительный знак с восклицанием | 9,917,601 | 0.39 |
" кавычка | 38,699,719 | 1.44 |
() скобки | 64,022,430 | 2.09 |
: двоеточие | 151,004,545 | 5.18 |
; точка с запятой | 66,366,029 | 2.11 |
Буква | Всего (шт.) | Средняя частота использования (в %) |
А | 13,392,523,473 | 8.21 |
Б | 2,751,027,488 | 1.68 |
В | 7,248,478,760 | 4.38 |
Г | 2,829,852,613 | 1.71 |
Д | 4,955,693,644 | 3.02 |
Е-Ё | 13,793,628,417 | 8.38 |
Ж | 2,829,852,613 | 1.71 |
З | 2,762,489,179 | 1.69 |
И-Й | 13,231,424,768 | 7.97 |
К | 5,542,095,577 | 3.41 |
Л | 7,863,300,883 | 4.8 |
М | 5,319,926,365 | 3.24 |
Н | 10,863,501,382 | 6.57 |
О | 18,136,797,146 | 10.98 |
П | 4,637,742,808 | 2.82 |
Р | 7,462,566,784 | 4.49 |
С | 8,836,153,492 | 5.34 |
Т | 10,162,893,753 | 6.2 |
У | 4,583,054,304 | 2.83 |
Ф | 318,161,266 | 0.19 |
Х | 1,493,809,287 | 0.9 |
Ц | 647,552,078 | 0.39 |
Ч | 2,404,814,426 | 1.48 |
Ш | 1,343,113,308 | 0.84 |
Щ | 591,632,830 | 0.35 |
Ь-Ъ | 3,233,061,043 | 1.99 |
Ы | 3,086,467,271 | 1.89 |
Э | 566,881,700 | 0.34 |
Ю | 1,009,635,584 | 0.62 |
Я | 3,541,160,143 | 2.17 |
Сумма частей речи
Часть речи | Всего в текстах (шт.) | средний % в текстах |
Существительное | 8,501,292,196 | 23.17 |
Глагол | 2,966,624,372 | 20.7 |
Местоимение-существительное | 2,966,624,372 | 15.72 |
Предлог | 2,248,107,326 | 10.35 |
Союз | 2,705,267,869 | 8 |
Прилагательное | 2,248,107,326 | 5.95 |
Наречие | 1,844,316,321 | 5.68 |
Местоимение-прилагательное | 1,382,826,302 | 4.16 |
Частица | 1,439,121,042 | 3.77 |
Местоименное наречие | 504,239,789 | 1.39 |
Числительное | 178,270,279 | 0.53 |
Числительное-прилагательное | 72,927,426 | 0.16 |
Междометие | 31,362,481 | 0.04 |
Часть композита - сложного слова | 5,028,031 | 0.01 |
Последние комментарии
3 часов 35 минут назад
4 часов 42 минут назад
5 часов 40 минут назад
5 часов 54 минут назад
15 часов 5 минут назад
15 часов 6 минут назад