Лингвистический анализ: Роман с Data Science. Как монетизировать большие данные (Роман Зыков)



Общая статистика

Длина текста464495 знаков
Длина диалогов441 знаков
Слов в произведении (СВП)64948 слов
Приблизительно страниц259 стр.
Средняя длина слова5.82 знаков
Предложений в произведении (ПВП)4718 предл.
Средняя длина предложения (СДП)95.49 знаков
Доля диалогов в тексте0.09 %
Доля авторского текста99.91 %
СДП диалогов109.50 знаков
СДП авторского текста91.94 знаков
Использование диалогов по тексту книги № 527460: Роман с Data Science. Как монетизировать большие данные (Роман Зыков)
Максимальный фрагмент авторского текста - 204012 знаков (в страницах - примерно 113, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов13616
Активный словарный запас (АСЗ)11972
Активный не словарный запас (АНСЗ)1644
Удельный АСЗ на 3000 слов текста1447.9836018 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3671.2238403 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 527460: Роман с Data Science. Как монетизировать большие данные (Роман Зыков)
Максимальный УАСЗ-3000 (1574) наблюдается примерно на 1 странице
Минимальный УАСЗ-3000 (1285) наблюдается примерно на 87 странице
Рост АСЗ книги № 527460: Роман с Data Science. Как монетизировать большие данные (Роман Зыков)

Буквы и знаки препинания

Всего букв356518 букв
Всего знаков препинания13301 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, запятая547284.25
. точка504877.72
- тире101515.63
? вопросительный знак1832.82
! восклицательный знак260.40
... многоточие00.00
!.. восклицательный знак с многоточием00.00
?.. вопросительный знак с многоточием00.00
!!! тройной восклицательный знак00.00
?! вопросительный знак с восклицанием00.00
" кавычка440.68
() скобки70110.79
: двоеточие6309.70
; точка с запятой1822.80
БукваКол-во (шт.)Частота использования (в %)
А293098.22
Б57771.62
В136683.83
Г46961.32
Д108623.05
Е-Ё306198.59
Ж46961.32
З61931.74
И-Й319178.95
К117263.29
Л141013.96
М119443.35
Н246526.91
О3674510.31
П102302.87
Р173284.86
С179945.05
Т259967.29
У82442.31
Ф12360.35
Х37281.05
Ц16980.48
Ч57971.63
Ш22400.63
Щ9800.27
Ь-Ъ71162.00
Ы78682.21
Э15800.44
Ю23360.66
Я71452.00
Диаграма использования букв книги № 527460: Роман с Data Science. Как монетизировать большие данные (Роман Зыков)

Части речи

Определенных частей речи (ОЧР)60696 слов
Не определенных частей речи (НОЧР)4252 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Существительное1975732.551
Глагол428215.342
Местоимение-существительное42827.055
Предлог508311.539
Союз46598
Прилагательное50838.375
Наречие40416.658
Местоимение-прилагательное33385.500
Частица16512.720
Местоименное наречие7741.275
Числительное4440.732
Числительное-прилагательное3350.552
Междометие60.010
Часть композита - сложного слова100.016

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

СуществительноеГлаголМестоимение-существительноеПредлогСоюзПрилагательноеНаречиеМестоимение-прилагательноеЧастицаМестоименное наречиеЧислительноеЧислительное-прилагательноеМеждометиеЧасть композита - сложного слова
Существительное88.1644.4521.5255.8239.3121.0723.2018.476.154.781.051.430.030.05
Глагол39.5216.829.7029.8712.1415.0811.739.464.072.161.980.840.030.02
Местоимение-существительное10.3526.812.974.184.504.179.262.094.681.020.300.230.000.00
Предлог59.611.7013.891.481.7516.181.2014.810.250.352.132.010.020.03
Союз17.6015.269.937.333.305.426.973.615.291.350.440.260.000.00
Прилагательное60.023.671.654.185.264.741.550.940.770.560.210.150.000.03
Наречие7.3223.104.456.364.637.666.922.442.240.760.510.200.000.00
Местоимение-прилагательное28.806.973.332.222.015.912.410.921.500.380.280.230.020.02
Частица3.9710.891.172.751.121.651.811.450.991.100.200.100.000.00
Местоименное наречие1.143.131.650.692.110.861.150.531.170.260.070.000.000.00
Числительное5.340.120.130.200.300.680.160.200.070.000.080.050.000.00
Числительное-прилагательное3.510.510.160.280.350.280.210.080.030.020.070.020.000.00
Междометие0.070.000.000.020.000.000.000.000.000.020.000.000.000.00
Часть композита - сложного слова0.100.000.000.000.000.050.000.000.000.000.000.000.000.02

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Существительное16.6931.2231.6230.9232.24
Глагол7.4516.0220.9620.4118.07
Местоимение-существительное11.9710.408.997.016.46
Предлог18.167.719.0211.1011.58
Союз13.674.614.955.716.08
Прилагательное6.107.477.688.618.47
Наречие11.367.217.116.946.28
Местоимение-прилагательное6.827.405.005.375.60
Частица2.084.282.692.182.74
Местоименное наречие3.551.280.950.730.95
Числительное0.340.470.670.651.21
Числительное-прилагательное1.781.910.330.310.33
Междометие0.000.020.000.020.00
Часть композита - сложного слова0.020.000.020.050.00

Номер слова в предложении
678910
Существительное32.1432.9032.7231.6531.31
Глагол16.3316.0814.6913.8114.42
Местоимение-существительное6.196.186.225.956.72
Предлог11.9911.0812.5712.6712.35
Союз7.678.037.689.618.87
Прилагательное9.499.159.399.379.33
Наречие6.066.076.846.076.16
Местоимение-прилагательное5.365.665.035.765.55
Частица2.242.642.442.772.94
Местоименное наречие1.271.151.111.111.07
Числительное0.960.691.110.860.90
Числительное-прилагательное0.290.330.170.370.37
Междометие0.000.030.000.000.00
Часть композита - сложного слова0.030.000.030.000.00

Номер слова в предложении
1112131415
Существительное32.3330.5331.4832.3631.06
Глагол14.5015.4614.9713.7914.12
Местоимение-существительное5.656.307.136.356.44
Предлог12.2113.1212.0212.3212.14
Союз7.799.008.288.428.41
Прилагательное9.319.879.348.5210.56
Наречие6.635.756.126.316.49
Местоимение-прилагательное5.945.194.935.915.65
Частица3.522.543.263.742.65
Местоименное наречие1.051.031.320.941.36
Числительное0.650.830.970.740.62
Числительное-прилагательное0.330.360.130.540.45
Междометие0.040.000.000.000.06
Часть композита - сложного слова0.040.000.040.050.00