?

Log in

No account? Create an account

BRITISH ENGLISH lessons by Anton Brejestovski

Hoping this blog will help you a bit if you're learning English...

Previous Entry Share Flag Next Entry
Взяли мы тут 27000 английских книг. Разделили их на слова. Получилось 16 миллиардов букв.
Anton
brejestovski

Взяли мы тут 27000 английских книг. Разделили их на слова. Получилось 16 миллиардов букв. А потом стали делать разные интересные штуки с этими словами. А заоодно обнаружили кучу занятной информации.

Вот, например:

Десять самых часто встречающихся слов:

1 - the (с большим отрывом - 125 миллионов раз)

2 - and (59 миллионов раз)
3 - to
4 - of
5 - he (шовинизм: слово "she" - на 14 месте)
6 - was
7 - in
8 - it
9 - not
10 - you (26 миллионов раз)


Как видите, ни одного существительного или прилагательного.

А знаете, когда в этом списке появляется первое существительное? Оно лишь на 68 месте. А какое? Оказывается, самое часто употребительное существительное английского языка - TIME.


А первое прилагательное и того ниже - на 110 месте. Это слово GOOD.


  • 1
Все это было уже сделано 100 лет назад, причем многократно.
Выпускаются и печатаются даже целые частотные словари (frequency dictionaries).







Существительные

Глаголы

Прилагательные

спасибо, именно поэтому я спросил - интересно насколько отличается результат автора..

Не должен вроде отличатся: 27,000 книг - это большой массив для анализа. Думаю (wild guess) возможно где-то 3-5% расхождение из-за субьективности (или случайности?) составления выборки.

  • 1