Анализ проводился только над русскоязычными текстами. Минимальный размер обрабатываемой fb2 книги - 50 Кб. За одну страницу принято среднее значение в 1800 символов. Уникальные слова - это все встреченные уникальные слова при разборе (включая слова с ошибками, в разных склонениях, придуманные слова и имена и т.д.)
Суммарные данные анализа:
Всего обработано | 515281 книг |
Суммарная длинна текстов | 207,910,071,198 знаков |
Суммарная длинна диалогов | 57,351,229,064 знаков |
Суммарное количество слов | 31,235,979,110 слов |
Всего страниц | 115,763,121 страниц |
Всего предложений | 2,801,754,007 предложений |
Средние данные книг:
Средняя длинна текста | 403489 знаков |
Средняя длинна диалогов | 111301 знаков |
Среднее количество слов в произведении | 60619 слов |
Среднее количество страниц в произведении | 225 страниц |
Средняя длина слова | 5.29 знаков |
Среднее количество предложений в произведении | 5437 предложений |
Средняя длина предложения | 80 знаков |
Средняя доля диалогов в тексте | 27 % |
Средняя доля авторского текста | 73 % |
СДП диалогов | 69 знаков |
СДП авторского текста | 96 знаков |
Средний активный словарный запас
Всего использовано уникальных слов | 2,364,325 слов |
Средний активный авторский словарный запас (САСЗ) | 12825 |
Средний активный авторский не словарный запас (САНСЗ) | 463 |
Удельный САСЗ на 3000 слов текста | 1488 |
Удельный САСЗ на 10000 слов текста | 3857 |
Удельный САСЗ на 100000 слов текста | 20886 |
Статистика букв и знаков препинания
Всего букв | 164,706,092,181 букв |
Всего знаков препинания | 7,231,343,107 знаков |
Знак | Суммарное количество (шт.) | Суммарное среднее количество на 1000 слов (шт.) |
, запятая | 3,521,159,896 | 112.58 |
. точка | 2,469,170,557 | 80.41 |
- тире | 411,663,580 | 14.05 |
? вопросительный знак | 274,843,830 | 9.27 |
! восклицательный знак | 191,530,316 | 7.01 |
... многоточие | 21,188,038 | 0.83 |
!.. восклицательный знак с многоточием | 5,265,774 | 0.2 |
?.. вопросительный знак с многоточием | 4,208,204 | 0.15 |
!!! тройной восклицательный знак | 1,721,373 | 0.08 |
?! вопросительный знак с восклицанием | 9,938,582 | 0.39 |
" кавычка | 38,757,988 | 1.44 |
() скобки | 64,130,560 | 2.09 |
: двоеточие | 151,318,388 | 5.18 |
; точка с запятой | 66,446,161 | 2.1 |
Буква | Всего (шт.) | Средняя частота использования (в %) |
А | 13,427,145,405 | 8.21 |
Б | 2,757,995,285 | 1.68 |
В | 7,266,844,210 | 4.38 |
Г | 2,836,919,383 | 1.71 |
Д | 4,968,304,815 | 3.02 |
Е-Ё | 13,828,663,360 | 8.38 |
Ж | 2,836,919,383 | 1.71 |
З | 2,769,599,805 | 1.69 |
И-Й | 13,264,644,780 | 7.97 |
К | 5,556,274,892 | 3.41 |
Л | 7,883,456,127 | 4.8 |
М | 5,333,672,846 | 3.24 |
Н | 10,891,123,296 | 6.57 |
О | 18,183,296,210 | 10.98 |
П | 4,649,813,117 | 2.82 |
Р | 7,481,648,890 | 4.49 |
С | 8,858,647,581 | 5.34 |
Т | 10,189,340,275 | 6.21 |
У | 4,595,026,395 | 2.83 |
Ф | 318,905,633 | 0.19 |
Х | 1,497,589,125 | 0.9 |
Ц | 649,145,335 | 0.39 |
Ч | 2,411,058,238 | 1.48 |
Ш | 1,346,640,776 | 0.84 |
Щ | 593,160,301 | 0.35 |
Ь-Ъ | 3,241,569,656 | 1.99 |
Ы | 3,094,396,092 | 1.89 |
Э | 568,324,758 | 0.34 |
Ю | 1,012,218,021 | 0.62 |
Я | 3,550,586,103 | 2.17 |
|
Сумма частей речи
Часть речи | Всего в текстах (шт.) | средний % в текстах |
Существительное | 8,522,266,360 | 23.17 |
Глагол | 2,974,473,355 | 20.7 |
Местоимение-существительное | 2,974,473,355 | 15.72 |
Предлог | 2,253,546,628 | 10.35 |
Союз | 2,712,395,020 | 8 |
Прилагательное | 2,253,546,628 | 5.95 |
Наречие | 1,849,427,810 | 5.68 |
Местоимение-прилагательное | 1,386,439,202 | 4.16 |
Частица | 1,443,051,895 | 3.77 |
Местоименное наречие | 505,606,249 | 1.39 |
Числительное | 178,730,246 | 0.53 |
Числительное-прилагательное | 73,125,154 | 0.16 |
Междометие | 31,446,258 | 0.04 |
Часть композита - сложного слова | 5,038,707 | 0.01 |
Последние комментарии
1 день 9 часов назад
1 день 11 часов назад
2 дней 2 часов назад
2 дней 2 часов назад
2 дней 7 часов назад
2 дней 11 часов назад