?

Log in

No account? Create an account

BRITISH ENGLISH lessons by Anton Brejestovski

Hoping this blog will help you a bit if you're learning English...

Previous Entry Share Next Entry
Взяли мы тут 27000 английских книг. Разделили их на слова. Получилось 16 миллиардов букв.
Anton
brejestovski

Взяли мы тут 27000 английских книг. Разделили их на слова. Получилось 16 миллиардов букв. А потом стали делать разные интересные штуки с этими словами. А заоодно обнаружили кучу занятной информации.

Вот, например:

Десять самых часто встречающихся слов:

1 - the (с большим отрывом - 125 миллионов раз)

2 - and (59 миллионов раз)
3 - to
4 - of
5 - he (шовинизм: слово "she" - на 14 месте)
6 - was
7 - in
8 - it
9 - not
10 - you (26 миллионов раз)


Как видите, ни одного существительного или прилагательного.

А знаете, когда в этом списке появляется первое существительное? Оно лишь на 68 месте. А какое? Оказывается, самое часто употребительное существительное английского языка - TIME.


А первое прилагательное и того ниже - на 110 месте. Это слово GOOD.


  • 1

ничего не поняла

разделили на слова, получили буквы, а "потом стали делать разные интересные штуки с этими словами"


всё это делается программно
разобрали по словам все эти книги, получили статистическую выборку
а потом разной сложности запросами получают разную информацию


то есть вы непрограммист рассказываете программисту с многолетним стажем, как это делается? :))

вы даже не поняли, что я написала, а туда же со своими фантазиями


Edited at 2015-10-25 02:00 am (UTC)

Мой стаж программиста начался в 1989 году, в 10-летнем возрасте, когда я впервые записал скан-код нажатой клавиши в регистр AX процессора КР580ВМ1 и вызвал подпрограмму ПЗУ, издающую звук заданной в этом регистре высоты...
Так что давайте для начала определимся с набором используемых библиотек и структурой свойств экземпляров классов, прежде чем выпячивать грудь =)


вы сначала читать научитесь и понимать прочитанное :)

программист )))


С вашей логикой спорить не буду.
Нахера слова-то на буквы разбирать, женщина?

Правильно говорят, что женщин-программистов не бывает, одни кодеры.


ну если программисты разделяют на слова и при этом получают буквы, а потом делают разные штуки с "этими" словами, которых по сути уже нет, одни буквы, то мы лучше с женщинами-кодерами :)

зарплаты сравнивать не будем - у вас просто нет шансов, лузерам конкурирующим на уровне гендерных комплексов, столько не платят


тётенька, я давным-давно не работаю за зарплату
кстати, вы можете поработать на меня, если знаете, если пройдёте небольшой тест


так об этом и речь, что такую зарплату тебе не дадут, фрилансер


Правильно. Если бы разделили на буквы, было бы гораздо интересней.


так они их так получили, делением слов


для программиста у вас изрядные проблемы с абстракциями...
тексты делились на слова, не на буквы...
16 миллиардов букв - это количество букв из которых состоит набор полученных уникальных слов


а у вас логикой и пониманием текста


А в попугаях я гаааараздо длиннее ))


три игрока берут четыре фишки причем пятый все время выбрасывает


  • 1