Архив автора: Andrey Fedorov

Gensim Word2Vec при multi-label classification и sentiment analysis

В предыдущей статье я подробно рассмотрел как выглядит внутреннее устройство embedding. Там же рассмотрен один из способов использования Gensim embedding word2vec. В этой статье рассмотрю второй способ встраивания слоя embedding в нейронную сеть. Embedding, помимо уменьшения требований к памяти, ценен … Читать далее

Рубрика: IT рецепты | Оставить комментарий

Парсинг финансовой информации с Yahoo Finance

Для анализа финансовых данных необходимо их получить. Near realtime данные проще забирать с Yahoo Finance, нежели с Bloomberg. Видимо из-за новостной ориентации Bloomberg защита от web scraping значительно серьезнее. Если неосторожно забирать данные, то легко получить страницу с запросом captcha. … Читать далее

Рубрика: IT рецепты | Метки: , , , , , , | Оставить комментарий

Разметка текста для multi-label classification нейронной сетью

Для тренировки нейронной сети нужен размеченный текст. Нередко разметку текста производят фрилансеры. Файл для разметки может быть подготовлен разными способами. Один из таких вариантов — разметка непосредственно в Word. Например, есть отзывы о продукте, которые нужно разметить силами фрилансеров. Отзывы … Читать далее

Рубрика: IT рецепты | Метки: , , , | Оставить комментарий

Анализ текстов нейронными сетями. Bag Of Words vs. Embedding.

Анализ текстовой информации — весьма полезный инструмент. Я ранее публиковал уже статьи на тему анализа текстов. Например, анализ авторства текста, генеративные сети с условием (в этих GAN-ах использовался слой embedding), чатботы и пр. Пора систематизировать способы представления текстов в числовой … Читать далее

Рубрика: IT рецепты | Метки: , , , | Оставить комментарий

Как работает реккурентная нейронная (RNN) сети при анализе текстов

Эта статья — конспект лекции Константина Слепова, читаемой в «Университете искуственного интеллекта» в курсе «Углубленный курс по текстам (Natural Language Processing)». Предположим есть задача последовательного предсказания букв некоторой последовательности. Например, мы хотим получить модель в которой по трем буквам происходит … Читать далее

Рубрика: IT рецепты | Метки: , , , | Оставить комментарий

Прогноз заболеваемости коронавирусом в России

В Интернет хватает графиков показывающих текущую ситуацию с заболеваемостью коронавирусом в России, но почему-то не удалось найти прогноз. Графики отражающие текущую ситуацию: 2GIS Yandex.Map Мне не удалось найти статистику заболеваемости коронавирусом в табличном виде, поэтому данные брал из этих диаграмм. … Читать далее

Рубрика: IT рецепты | Оставить комментарий

Tensorflow и Keras. Convolution слои. Часть 2.

В предыдущей статье я очень подробно разобрал построение архитектуры нейронной сети на dense слоях в Keras и Tensorflow. В этой статье рассмотрю сверточные (convolutional) слои. Эта статья, как и предыдущая, использует материалы лекций Сергея Кузина читаемых в «Университете искусственного интеллекта», … Читать далее

Рубрика: IT рецепты, Нейронные сети | Метки: , , , , , | Оставить комментарий