anna_frid: (Default)
Последние несколько дней я разбиралась с нейронными сетями на примере заголовков желтой газеты Daily Mail - точнее, выжимок из заголовков, служащих названиями веб-страниц. Практических применений этому добру пока не нашлось, но развлекуха получается прекрасная.

Например, можно брать любое слово и смотреть, какие слова - на материалах, напомню, заголовков Daily Mail - кажутся нейронной сети близкими по смыслу к данному, то есть могут встретиться в похожем контексте.

Числа после слов не слишком осмысленны, но вот каковы подборки!

model.most_similar("woman")

[('womans', 0.7180080413818359),
('mother', 0.6403418183326721),
('stranger', 0.6242644190788269),
('nurse', 0.6231988668441772),
('grandmother', 0.6228614449501038),
('man', 0.6143352389335632),
('teenager', 0.6095441579818726),
('pensioner', 0.5887019634246826),
('patient', 0.5778872966766357),
('student', 0.575697124004364)]

model.most_similar("man")

[('woman', 0.6143352389335632),
('teenager', 0.5835971832275391),
('mans', 0.5656498074531555),
('pensioner', 0.5557718276977539),
('stranger', 0.540886640548706),
('trucker', 0.5337430238723755),
('suspect', 0.5272442102432251),
('bystander', 0.5262438058853149),
('motorist', 0.5239924192428589),
('homeowner', 0.5030730366706848)]


То есть смотрите: в мире Daily Mail и мужчины, и женщины могут быть подростками, пенсионерами и посторонними людьми. Но женщины еще бывают матерями и бабушками, медсестрами, пациентками и, что самое интересное, студентками. А мужчины студентами, отцами или там дедами не бывают, зато бывают водителями (в том числе дальнобойщиками), домовладельцами, подозреваемыми и очевидцами. По-моему, это прекрасно.

Кидайте английские слова в комменты, расскажу, на что они похожи в мире Daily Mail.
anna_frid: (Default)
Скоро кончится семестр, и у меня освободится немножко времени на разнообразные эксперименты. Пора уже продумывать, на какие! Поэтому. Что бы мне такого обработать или посчитать в духе предыдущих моделек? Сама я, конечно, тоже что-нибудь придумаю и найду, но вдруг у вас есть какая-то давняя идея в таком духе - так я гляну. Единственное условие - если для подсчета нужны данные, надо иметь представление о том, где и как их брать.
anna_frid: (космы)
Вдохновившись комментариями, понастроила еще графиков про популярность имен среди девочек и мальчиков.

тыц )


И отдельно про имя Крис, которое в большинстве случаев не полное имя (как на первом графике), а сокращение (как на втором, где участвуют все Кристины и Кристоферы).

1 2



Что мы видим из этих графиков? Я бы сказала, что чаще всего происходит одно из двух. Имя либо всю дорогу остается скорее мужским, чем женским, либо меняет основной гендер ровно один раз: начинает восприниматься как скорее женское, чем мужское. Исключений, не считая Крисов, которые сокращения, по сути три:

- Джесси, у которого просто самая длинная история,
- Пейтон, которое долго было равно популярным среди обоих полов,
- и Энджел, единственное имя, которое некоторое время было скорее женским, а потом стало скорее мужским.

Пример Энджелов поразительный, потому что обычно работают понятные общественные механизмы: девочке дать имя скорее мужское - это ей пойдет только на пользу, а мальчику дать скорее женское - фу, засмеют, или, не дай бог, за женщину примут. Но пример Энджелов таки обнадеживает, что эта ситуация не вечна.
anna_frid: (космы)
Побаловалась с данными американской Social Security на тему имен, даваемых младенцам. У них там собрано количество мальчиков и девочек с каждым именем аж с 1880 года, и в сумме, и по каждому штату. Единственная неточность - не упомянуты имена, носителей которых в списке было меньше пяти, поэтому в сумме по штатам людей упомянуто меньше, чем в общем файле.

Меня интересовали имена, которые даются и мальчикам, и девочкам, причем в мало-мальски разумной пропорции. То есть в 1880 году, к примеру, зарегистрировано 27 мальчиков по имени Mary, но имя Mary считать гендерно-нейтральным все-таки не стоит, потому что девочек с таким именем в тот же год было 7065. Будем - ну, от балды - гендерно-нейтральными считать имена, у которых носительниц не более чем в десять раз больше или меньше, чем носителей.

Чтобы долго не разглагольствовать, просто два списка и две картинки.
тыц )
anna_frid: (космы)
Развлеклась программированием простенькой модельки общества, в котором принято, чтобы муж был выше жены. Что получится со средним ростом мужчин и женщин через, скажем, двадцать поколений такой традиции, при условии, что факторы, влияющие на рост, хоть сколько-то сцеплены с полом, то есть на рост дочери рост матери имеет большее влияние, чем рост отца, и наоборот?

длинно, зато с парой графиков )

Вывод: общественные представления о допустимом запросто могут за считанные поколения на существенную величину увеличивать половой диморфизм. При единственном нетривиальном условии: на рост ребенка большее влияние имеет рост родителя того же пола. Каков вес этого фактора на самом деле - разумеется, вопрос, для ответа на который нужна чертова уйма реальных статистических данных, которых у меня нет.

Profile

anna_frid: (Default)
anna_frid

July 2017

S M T W T F S
      1
2 34 5678
9101112131415
16171819202122
23 24 2526272829
3031     

Syndicate

RSS Atom

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Aug. 22nd, 2017 11:02 am
Powered by Dreamwidth Studios