Страницы Миллбурнского клуба, 1 - страница 88

он время отвремениживет в квартиреМирумова ипосвящаетему своипервые произведения.

Какие-либоизменения вписательскомстилеШолохова междупервой ивторойчастямиповести «Путь-дороженька»,опубликованнойв 1925 году,представляютсямаловероятными.

Послепредварительнойобработкитекста повести«Путь-дороженька»(включающей,в частности,удалениеимен собственных)мы разбиликаждую частьповести на 30равныхчастей по 2000байт каждая.Средние безусловныесложности

 былистатистическиодинаковы.Средняя интра-CCCв каждойчасти быласравнена сосредней интер-CCCкаждогокуска,обучаемогона другойчасти. Ихсреднеквадратичныеотклонениястатистическинеразличались.Разностьмежду среднейинтер-CCC исредней интра-CCCоказаласьзначимой,превышая вчетыре разаеесреднеквадратичноеотклонение.

 

             График1.Интер-ССС                     График 2. Интра-ССС

Деталивычисленийтаковы: мыпосчитали 30 интер-CCC(кусок части 2плюс часть 1целиком) и 30 интра-CCC(кусок части 1плюсостающийсятекст части 1). Средняяинтер-CCC:

, и средняя интра-CCC:
. Их разностьравна 17.34,среднеквадратичноеотклонение интер-CCCравно
, среднеквадратичноеотклонение интра-CCCравно
.Среднеквадратичноеотклонениеразности
 равно                                       
.F-отношение < 2допускаетиспользованиеt-критериясо значениемстатистики,равным                                          
.

Это t-значениепри числестепенейсвободы 58делаетсоответствующеезначение P (тоесть вероятностьтакого же илибольшегоCCC-отклонения),равнымпримерно

.

Замечание.В нашихвычисленияхмы предполагали,что интер-CCCразличныхкусков текстанезависимы.Нампредставляетсяэто разумнойаппроксимацией.Интра-CCC могутиметьнебольшуюкорреляцию.Например,выборочныйкоэффициенткорреляциимежду первымипятнадцатьюи последнимипятнадцатьюинтра-CCC части 1равен только0.156. Такая маленькаякорреляцияне можетзначительноизменить t-критерий.

Нашивычисления t-критерияпо двумвыборкамговорят отом, что двечастинаписаныразнымиавторами (длядовольновысокогоуровнязначимости).Результаттакого независимогоотсодержанияисследованияподтверждаетсяаналогичнымзаключениемс помощьюлингвистическогоанализа в работеБар-Селлы [1].Следуетподчеркнуть,что результатыэтих двухисследованийоснованы наразличныхсвойствахтекста и,таким образом,взаимноподтверждаютдруг друга.

АвторыблагодарныЗеевуБар-Селле засовет по выборуприложения иприсылкуоригинальноготекстаповести.

Цитированнаялитература

1.Бар-Селла, З. (2005).Литературныйкотлован:проект «ПисательШолохов»,Российскийгосударственныйгуманитарныйуниверситет.

2. Марусенко,М.А., Бессонов,Б.А.,Богданова,Л.М., Аникин, М.А.,Мясоедова,Н.Е. (2001). Впоискахпотерянногоавтора, Изд-воФилологическогофакультетаСПбГУ.

3. Kolmogorov, A.N. (1965). Threeapproaches to the quantitative definition of information, Problems ofinformation transmission, 1, 3–11.

4.Малютов, М.Б. (2005).Атрибуцияавторстватекстов:Обзор.  Обзорыпоприкладной ипромышленнойматематике, 12, No.1, 2005, 41 – 77.

5. Malyutov, M.B., Wickramasinghe, C. I., Li, S. (2007).Conditional Complexity of Compression for Authorship Attribution, SFB 649Discussion Paper No. 57, Humboldt University, Berlin.

6.Малютов, М.,Бродский, С. (2011).Атрибуцияавторстватекстов,Материалымеждународнойнаучнойконференции «В.В.Налимов –математик ифилософ, к 100-летиюсо днярождения».

7.Малютов, М.Б.,Бродский, С. (2009).MDL-процедурадляатрибуцииавторства текстов,Обозрениеприкладной ипромышленнойматематики,том 16, вып. 1, 25 – 34.

8. Ryabko, B., Astola, J. Malyutov, М.(2010). Compression-Based Methods of Prediction and Statistical Analysis ofTime Series: Theory and Applications. Tampere International Center for Signal Processing. TICSP series No. 56, ISBN 978-952-15-2444-8, ISSN 1456 – 2774,115 pages.

9.Хмелев, Д.В. (2001).Сложностнойподход кзадачеопределенияавторстватекста,Тезисыконгресса «Русскийязык», Фак. филологииМГУ, 426 – 427.

10. Cilibrasi, R., Vitanyi, P. (2005). Clustering byCompression, IEEE Trans. Inform. Th., IT-51, 1523 – 1545.

ИгорьМандель –статистик,докторэкономическихнаук, родилсяи жил вплотьдо отъезда вАмерику в Алма-Ате,хотяпубликовалсяглавнымобразом в Москве;преподавалстатистику вИнститутеНародногохозяйства;работал вамериканскихинвестиционныхкомпаниях в90-е годы, занимаядолжности отконсультантадо директорапредприятий.С 2000 года вАмерике.Занимаетсястатистикойв применениик маркетингу.Публикуетнаучныеработы. Нарусском языкевышли двекнигиироническойпоэзии (в соавторствес коллегами);статьи охудожниках ина другиетемы и стихивинтернетныхальманахах Lebed.comи berkovich-zametki.com. Живетв Fair Lawn, NJ.

Любовьи кровьНиколаяОлейникова *