Архив рубрики: IT рецепты

Вставка текста на сайтах с запретом копирования (copy/paste)

На сайтах государственных услуг безумные разработчики любят запрещать вставку текста в поле обращения. Мотивируют это какой-то защитой от всякой нечисти. 🙂 В результате написание обращения с цитированием фраз из документов и вставкой номеров документов, реквизитов и пр. усложняется. Рассмотрим для … Читать далее

Рубрика: IT рецепты, IT решения для государства | Оставить комментарий

Резервное копирование коробочного Битрикс-а по ftp на NAS Synology

Нередко возникает задача резервного копирования файлов Битрикса. В стандартрных настройках Битрикса в панели управления есть две опции: резервные копии в облаке (там немного пространства) и на локальный диск. Очевидно,что хранить резервные копии на локальном диске — все равно что «держать … Читать далее

Рубрика: IT рецепты | Оставить комментарий

«BortX» — SCADA на базе ESP8266 или скетч, превращающий ESP8266 в SCADA.

Микропроцессоры ESP8266 приобрели широкую известность. Программирование осуществляется с помощью Arduino IDE и это не единственный вариант. Немало времени уходит на освоение языка с++, на изучение библиотек. А задача бывает порой очень простая, например, проверить закрыта ли дома дверь, то есть … Читать далее

Рубрика: IT рецепты | Оставить комментарий

Seq2Seq модель для построения чатбота на Keras

В предыдущей статье я подробно разобрал учебный пример использования seq2seq модели для разработки чатбота. В этой реализации seq2seq используется преобразование обучающей последовательности подаваемой на выход декодера модели в One Hot Encoding. Поскольку на выходе получается гигантская разреженная матрица, то она … Читать далее

Рубрика: IT рецепты, Нейронные сети | Метки: , , , , , | Оставить комментарий

Scraping (парсинг) сайта HistData.com на Python c Google Colab

В прошлой статье я довольно подробно разобрал пример парсинга поисковых запросов Google и статей Bloomberg. Для обучения нейронок данных нужно много. 🙂 В этой статье рассмотрю как выполнить парсинг слегка защищенных сайтов, вроде histdata.com Попиарю этот ресурс — он очень … Читать далее

Рубрика: IT рецепты | Метки: | Оставить комментарий

Scraping (парсинг) текстов статей с Bloomberg на Python в Google Colab

Важный момент для аналитиков данных — где взять данные и максимально дешево, поскольку для обучения нейронных сетей их нужно много. Те, кто эти данные имеет, копит и улучшает расположены к тому, чтобы продать их подороже. При анализе данных нет уверенности, … Читать далее

Рубрика: IT рецепты | Оставить комментарий

Named-Entity Recognition (NER) анализ текстов на Keras

Named-Entity Recognition (NER) довольно коряво переводится на русский как распознавание именованных сущностей. Рассмотрим пример обработки текста размеченного фрилансерами для решения задачи NER. В статье будут использоваться информация полученная на лекциях в курсе «Углубленный курс по текстам (Natural Language Processing)», читаемых … Читать далее

Рубрика: IT рецепты | Оставить комментарий