Лингвистический анализ: Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных (Дэвид Хэнд)



Общая статистика

Длина текста586516 знаков
Длина диалогов240 знаков
Слов в произведении (СВП)79902 слов
Приблизительно страниц326 стр.
Средняя длина слова5.99 знаков
Предложений в произведении (ПВП)4620 предл.
Средняя длина предложения (СДП)123.98 знаков
Доля диалогов в тексте0.04 %
Доля авторского текста99.96 %
СДП диалогов39.17 знаков
СДП авторского текста118.84 знаков
Использование диалогов по тексту книги № 564913: Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных (Дэвид Хэнд)
Максимальный фрагмент авторского текста - 5281 знаков (в страницах - примерно 3, начинается где-то с 1 страницы)

Активный словарный запас

Использовано уникальных слов17258
Активный словарный запас (АСЗ)15373
Активный не словарный запас (АНСЗ)1885
Удельный АСЗ на 3000 слов текста1489.15332826 место в рейтинге УАСЗ-3000
Удельный АСЗ на 10000 слов текста3852.33311977 место в рейтинге УАСЗ-10000
Удельный АСЗ на 100000 слов текста0.00
Удельный АСЗ-3000 книги № 564913: Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных (Дэвид Хэнд)
Максимальный УАСЗ-3000 (1676) наблюдается примерно на 159 странице
Минимальный УАСЗ-3000 (1184) наблюдается примерно на 228 странице
Рост АСЗ книги № 564913: Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных (Дэвид Хэнд)

Буквы и знаки препинания

Всего букв457676 букв
Всего знаков препинания16424 знаков

ЗнакКол-во (шт.)Средн. кол-во на 1000 слов (шт.)
, запятая9208115.24
. точка484660.65
- тире99512.45
? вопросительный знак1361.70
! восклицательный знак500.63
... многоточие00.00
!.. восклицательный знак с многоточием00.00
?.. вопросительный знак с многоточием20.03
!!! тройной восклицательный знак10.01
?! вопросительный знак с восклицанием10.01
" кавычка00.00
() скобки4575.72
: двоеточие6458.07
; точка с запятой831.04
БукваКол-во (шт.)Частота использования (в %)
А332557.27
Б70801.55
В190164.15
Г61411.34
Д135692.96
Е-Ё407258.90
Ж61411.34
З78591.72
И-Й409738.95
К140963.08
Л179393.92
М156633.42
Н341777.47
О4885310.67
П127332.78
Р206524.51
С236385.16
Т321767.03
У98422.15
Ф15530.34
Х54021.18
Ц22950.50
Ч76411.67
Ш25190.55
Щ17540.38
Ь-Ъ74961.64
Ы118462.59
Э20540.45
Ю36810.80
Я90261.97
Диаграма использования букв книги № 564913: Темные данные. Практическое руководство по принятию правильных решений в мире недостающих данных (Дэвид Хэнд)

Части речи

Определенных частей речи (ОЧР)75635 слов
Не определенных частей речи (НОЧР)4267 слов

Часть речиКол-во (шт.)% в тексте (ОЧР - 100%)
Существительное2414231.919
Глагол508015.780
Местоимение-существительное50806.716
Предлог744510.982
Союз66289
Прилагательное74459.843
Наречие40615.369
Местоимение-прилагательное44455.877
Частица23983.170
Местоименное наречие6710.887
Числительное3480.460
Числительное-прилагательное1660.219
Междометие80.011
Часть композита - сложного слова20.003

Биграммы частей речи

В таблице показаны частоты словопар типа «сглагол+уществительное», «предлог+прилагательное» и т.д. Частота выражена в среднем количестве пары на 1000 слов текста. Вертикаль отражает часть речи первого слова биграммы, горизонталь — второго.

СуществительноеГлаголМестоимение-существительноеПредлогСоюзПрилагательноеНаречиеМестоимение-прилагательноеЧастицаМестоименное наречиеЧислительноеЧислительное-прилагательноеМеждометиеЧасть композита - сложного слова
Существительное81.0554.1016.3050.5540.5527.3718.0919.266.863.460.940.620.010.03
Глагол36.9121.099.4128.1416.3018.519.648.926.281.231.160.190.000.00
Местоимение-существительное11.6722.112.923.587.764.636.241.865.500.590.210.070.010.00
Предлог55.792.0614.151.731.1115.571.4715.720.090.201.020.860.040.00
Союз20.3614.5711.258.734.448.127.056.175.500.950.330.160.000.00
Прилагательное71.384.131.775.126.815.741.360.850.740.400.080.050.010.00
Наречие4.5217.373.124.724.989.274.691.982.090.540.320.050.030.00
Местоимение-прилагательное29.057.065.224.052.005.552.101.261.890.170.290.130.000.00
Частица3.3613.121.942.431.442.172.182.271.411.200.120.050.000.00
Местоименное наречие0.791.810.930.451.860.690.700.201.280.110.050.000.000.00
Числительное3.000.210.010.150.170.710.130.160.030.000.030.000.000.00
Числительное-прилагательное1.230.160.130.170.190.110.030.080.030.010.050.010.000.00
Междометие0.030.010.000.010.010.000.010.030.000.000.000.000.000.00
Часть композита - сложного слова0.030.000.000.000.000.000.000.000.000.000.000.000.000.00

Части речи на позициях в предложении

Таблица показывает, с какой частотой употреблены автором различные части на позициях в предложении. Например, ячейка «глагол – 3» показывает с какой вероятностью третье слово в случайно взятом предложении произведения является глаголом. Вероятность выражена в процентах. В каждом столбце максимальное значение отмечено розовым цветом, что позволяет по первым трём-пяти столбцам примерно представить типичное для произведения начало предлоджения. Например, последовательность «местоимение-существительное, глагол, прилагательное, существительное» может быть чем-то вроде «Он срубил старое дерево...»

Номер слова в предложении
12345
Существительное17.3831.8131.3029.5431.54
Глагол6.0516.8818.8620.1919.16
Местоимение-существительное10.2610.038.747.375.88
Предлог18.348.308.779.9910.64
Союз17.236.557.167.377.35
Прилагательное6.927.598.579.5610.51
Наречие11.115.965.535.625.02
Местоимение-прилагательное7.916.826.256.005.39
Частица1.844.203.443.032.95
Местоименное наречие2.060.790.630.610.65
Числительное0.410.400.630.510.70
Числительное-прилагательное0.480.670.130.200.16
Междометие0.000.000.000.000.00
Часть композита - сложного слова0.000.000.000.000.05

Номер слова в предложении
678910
Существительное31.0532.4633.2132.7632.10
Глагол17.2316.3215.8916.0117.66
Местоимение-существительное6.125.645.885.895.39
Предлог11.3211.5411.0611.4111.44
Союз7.937.388.527.928.64
Прилагательное10.9811.0310.4011.2910.18
Наречие4.814.624.554.755.03
Местоимение-прилагательное6.546.076.375.635.21
Частица2.153.412.812.922.83
Местоименное наречие1.020.810.770.770.74
Числительное0.630.430.360.310.68
Числительное-прилагательное0.180.300.170.290.09
Междометие0.030.000.000.060.00
Часть композита - сложного слова0.000.000.000.000.00

Номер слова в предложении
1112131415
Существительное29.9030.8530.0130.5030.30
Глагол16.9315.7814.4015.2916.15
Местоимение-существительное5.526.476.207.226.38
Предлог11.5710.6211.4610.4210.64
Союз9.548.639.109.6510.48
Прилагательное10.5411.0811.8710.729.65
Наречие5.275.235.305.275.28
Местоимение-прилагательное5.836.146.515.935.71
Частица3.123.563.533.683.74
Местоименное наречие1.060.950.930.881.14
Числительное0.620.590.310.290.47
Числительное-прилагательное0.090.100.380.110.04
Междометие0.000.000.000.040.00
Часть композита - сложного слова0.000.000.000.000.00