1. Новые складчины Показать еще

    16.12.2017: Мастер Класс онлайн 2017 (Карина Киль)

    16.12.2017: [Школа моды FashionSchoolOnline] Скетчбук. Курс на развитие креативности (Гульнара Вахитова)

    16.12.2017: Профессиональная Food-съемка. Искусственный свет (Родион Ковенькин)

    16.12.2017: Английский За 6 Месяцев. Самостоятельно и Не Выходя из Дома!

    16.12.2017: Таро и отношения (Сергей Савченко) 2015

  2. Гость, если у Вас на каком либо сайте есть аккаунт с повышенным статусом, то и у нас вы можете получить соответствующий статус. Подробнее читайте здесь https://www.skladchik.biz/threads/83942/
    Скрыть объявление
  3. Нужен организатор Показать еще

    11.12.2017: Обережная и гармонизирующая магия дома и его пространств (Лана Палагнюк-Симаненко)

    10.12.2017: Алмазная спина [GIPERBAREA, Игорь Fresh Ковалёв]

    08.12.2017: Цикл "Стилистика как бизнес" (Анна Шарлай)

    04.12.2017: 2 миллиона в месяц на продаже студий - Андрей Сазонов

    04.12.2017: Биология (Videouroki) 6-7 класс

  4. Сбор взносов Показать еще

    15.12.2017: Постсоблазнение (Александр Галевич)

    12.12.2017: Перерождение Рода. Исцеление судьбы (день 2) (2017) (Елена Мирная)

    02.12.2017: 15 способов удвоить трафик и увеличить активность подписчиков в Инстаграм (Ксения Потапова)

    11.11.2017: Бизнес Коучинг (Андрей Парабеллум)

    07.11.2017: Курс по работе и заработку с Telegram

Открыто [Python] Скрипт чистки текста

Тема в разделе "Авторские складчины", создана пользователем Менеджер, 25 авг 2016.

Цена:
250р.
Взнос:
40р.

Список пока что пуст. Запишитесь первым!

    Тип: Стандартная складчина
    Участников: 0/100
  1. 25 авг 2016
    #1
    Менеджер
    Менеджер Организатор Организатор

    [Python] Скрипт чистки текста

    Предлагаю свой скрипт написанный на Python 3, который обрабатывает текст, собранный парсером и сохраняет только качественные предложения, устраняя в них различные ошибки.
    Скрипт работает аккуратно, сохраняя максимальное количество предложений. В очищенных текстах вы не найдете китайских иероглифов, знаков, изображающих кеды, смайликов и прочих ненужных символов, вы увидите только нормальный текст, знаки пунктуации и необходимые символы.
    По окончании работы скрипт выводит сообщения о времени работы, первоначальном и конечном размерах всех обрабатываемых файлов.
    Участники складчины получат скрипт на 920 строк (открытый код с комментариями), 3 словаря к нему (один словарь на 970 строк), двухстраничный документ, в котором описана установка интерпретатора Python, порядок работы со скриптом и словарями, бонус в виде 2 небольших полезных скриптов. Также я предлагаю настроенную портативную программу для написания/редактирования и выполнения кода.
    Материал рассчитан на тех, кто никогда не писал скриптов и программ.
    Я доволен качеством работы скрипта, предлагаю посмотреть 10 образцов обработанных текстов:


    Может получиться так, что после обработки своих текстов вы обнаружите какие-то "дефекты", что-то вам не понравится. Я готов буду рассмотреть такие тексты и внести изменения в код в ходе обсуждения после закрытия складчины. Длительную поддержку не обещаю, но если будут пожелания со стороны складчиков, внесу изменения в код.
     

Участники складчины [Python] Скрипт чистки текста смогут написать отзыв