1. Новые покупки Показать еще

    10.12.2016: Закупка как единый процесс от плана до исполнения контракта (Межникова Ю. Л.)

    10.12.2016: Отчетность в ПФР за 9 месяцев 2016 года (Константин Татаров)

    10.12.2016: Налог на прибыль в 2016 году: важные вопросы расчета налога (Александр Матиташвили)

    10.12.2016: Секреты журналистики или как стать журналистом без ВУЗА - видеокурс (Максим Стефанович)

    10.12.2016: Как получать заказы на изготовление мебели из интернета (Михаил Смирнов)

  2. Гость, если у Вас на каком либо сайте есть аккаунт с повышенным статусом, то и у нас вы можете получить соответствующий статус. Подробнее читайте здесь https://www.skladchik.biz/threads/83942/
    Скрыть объявление
  3. Нужен организатор Показать еще

    07.12.2016: Кaк прoдвигать сaйты Пoведенческими фaкторами - Арбaйтен

    07.12.2016: Технология получения эластичного рельефного материала под кожу крокодила

    06.12.2016: Программа для анализирования футбола «FootForecast».

    06.12.2016: Мотивационная игра "Яркое решение"

    04.12.2016: Набор для цветокоррекции в Davinci Resolve - Fovea Aspect!!!

  4. Сбор взносов Показать еще

    07.12.2016: Экшен панель + новая сборка пресетов от Jay Lay 2016

    07.12.2016: Третий глаз и астральное тело активации

    06.12.2016: Ты и Деньги счастливы вместе (Татьяна Жеребцова)(2016)

    06.12.2016: Марафон по копирайтингу (Петр Панда)(2016)

    05.12.2016: Энергетическое Восстановление Волос (Аргандини Титизари)(2016)

Открыто Content Downloader проект для парсинга с aliexpress.com

Тема в разделе "Скрипты и программы", создана пользователем Менеджер, 5 апр 2016.

Цена:
3500р.
Взнос:
40р.

(Основной список пока пуст)

    Тип: Стандартная складчина
    Участников: 0/100
    1. 5 апр 2016
      #1
      Менеджер

      Менеджер Член клуба Член клуба

      Content Downloader проект для парсинга с aliexpress.com

      добрый день,

      Предлагаю скинуться на создание проекта для работы с программой Content Downloader для парсинга информации о товарах и отзывов с aliexpress.com

      всем кому интересно и нужен такой проект,
      в excel файле 1 есть 4 колоноки не относящихся к парсингу, они нужны для переноса в магазин на opencart, думаю их легко можно будет удалить из выдачи шаблона, если они вам не нужны.

      КРАТКО проект будет парсить
      excel файл 1
      ID товара на aliexpress.com, имя товара, рейтинг товара, кол-во отзывов о товаре, язык отзыва, имя покупателя, текст отзыва, рейтинг отзыва, дату и время отзыва
      +сохранять в папку все картинки из отзывав загруженные покупателями

      excel файл 2
      ID товара на aliexpress.com, имя товара, рейтинг товара, кол-во отзывов о товаре, кол-во заказов товара, стоимость, валюта стоимости, кол-во в наличии, даставка в срок (дней), время обработки заказа (дней)?, имя продавца, положительные отзыва продавца в %, рейтинг продавца, title, meta name keywords, meta name description, кол-ва добавивших товар в виш лист
      +сохранять все картинки каждого продукта

      я связалась с потенциальным исполнителем Фёдор Алексеевич [email protected]
      при ознакомлении с ТЗ получила ответ

      "За 3500 сделаю.
      Если подождете, то поработаем. Я на дня 4 набрал работы, так что сразу приступить не смогу.
      С Т.З. бегло ознакомился, но вроде как все должно получиться. Если что-то будет не получаться, то по ходу дела определимся как дальше действовать"



      предлагаю проект ТЗ ниже


      интересует стоимость проекта для content downloader, чтобы парсить отзывы о продуктах с aliexpress.com, которые вроде через javascript подгружаются


      прилагаю картинку и эксель файл со структурой данных

      в предложенном примере парсер обрабатывает отдельные ссылки на товары,

      также хотелось бы, чтобы забить слово в поиск алиэкспресс, например, стул, отсортировать по заказам и уже из этой ссылки, каталога продуктов (как бы вид как у категории, когда несколько продуктов на странице) извлекать ссылки на продукты с которыми потом проделывать все как для отдельной ссылки на продукт

      там при поиске происходит выгрузка из 12 строк в каждой по 4 продукта, потом переход на след страницу, так вот чтобы автоматически вытаскивать ссылки на продукты и переходить на след страницу, может задавать мах кол-во просматриваемых страниц, чтоб он до бесконечности не парсил


      в эксель файл 1

      ссылка на продукт из примера

      http://ru.aliexpress.com/item/flash...-flash-tattoo-feather-choker/32249522818.html

      в эксель файле 1 верхняя серая колонка с нумерацией колонок не нужна, она просто, чтобы более понятно было, этими номерами пронумеровала данные, которые парсить

      колонка 6 - просто последовательная нумерация отзывов
      колонка 7 - оставлять пустой
      колонка 8 - для всех, загружаемых строк значение 1
      колонка 12 - для всех, загружаемых строк значение 1
      колонка 13 - это как бы сводная колонок 14 и 15, но обязательно с форматом ячеек yyyy-mm-dd hh:mm


      необходимо в одну отдельную папку, сохранять большие фотографии, выложенные покупателями, если такие есть.

      Сделать возможность задавать 2 разных шаблона для именования выгружаемых фотографий
      1) именовать их как Product name.jpeg Product name-2.jpeg имя берется с дефисами flash-silver-gold-tattoos-glitter-metallic-body-art-tattoo-for-women-temporary-flash-tattoo-feather-choker.jpeg
      flash-silver-gold-tattoos-glitter-metallic-body-art-tattoo-for-women-temporary-flash-tattoo-feather-choker-2.jpeg

      2) именовать их как Product ID.jpeg Product ID-2.jpeg из примера 32249522818.jpeg и 32249522818-2.jpeg

      - возможно, у каждого отзыва есть свой ID, его тоже можно в отдельную колонку выгружать, чтобы при повторном парсинге одного продукта, уже спарсенные отзывы не выгружать, какую-то проверку для этого, если возможно

      - возможность задавать ограничение для выгружаемых отзывов на продукт, выгружать только отзывы с текстом или картинками, а в конце отзывы просто без текста их выгружать не нужно.

      или по другому, если как-то можно пропускать отзывы без текста, и избегать повторной загрузки отзывов при повторном парсинге ссылок уже пропарсенных продуктов


      в эксель файл 2, для тех же ссылок на продукты сохранять

      в эксель файле 1 верхняя серая колонка с нумерацией колонок не нужна, она просто, чтобы более понятно было, этими номерами пронумеровала данные, которые парсить

      колонка 1 - просто нумерация строк таблицы начиная со второй, те не считая строку заголовка
      колонка 9 - если можно выгружать валюту цены
      колонка 12 - время обработки заказа, уточните, если можно его сюда парсить, оно выскакивает при нажатии на кнопку купить, как видно на картинке проект файла 2.2.jpeg
      колонка 16,17,18 - берутся значения прописанные из кода страницы

      Также как и с отзывами необходимо в отдельную папку сохранять все большие фотографии со страницы продукта, т.е. в данном примере это 6 фотографий.

      Сделать возможность задавать 2 разных шаблона для именования выгружаемых фотографий

      1) именовать их как Product name.jpeg Product name-2.jpeg имя берется с дефисами flash-silver-gold-tattoos-glitter-metallic-body-art-tattoo-for-women-temporary-flash-tattoo-feather-choker.jpeg
      flash-silver-gold-tattoos-glitter-metallic-body-art-tattoo-for-women-temporary-flash-tattoo-feather-choker-2.jpeg

      2) именовать их как Product ID.jpeg Product ID-2.jpeg из примера 32249522818.jpeg и 32249522818-2.jpeg


      - При возникновении какой-либо ошибки должна быть возможность запустить парсер с последнего записанного товара.

      - Должны формироваться отчеты после завершения работы парсера – какие товары/ссылки обработаны, сколько ссылок обработано.


      пожалуйста уточните стоимость и все ли можно реализовать, если что-то нельзя напишите.

      организатору нужно связаться с исполнителем и заказать проект по ТЗ выше
       
    2. Загрузка...

      Similar Threads
      1. Менеджер
        Открыто

        Content Downloader X1 (Ultimate) – универсальный парсер

        Менеджер, 29 сен 2016, в разделе: Скрипты и программы
      2. Менеджер
        Открыто

        Content Downloader X1 (Ultimate) – универсальный парсер

        Менеджер, 2 сен 2016, в разделе: Скрипты и программы
      3. Менеджер
        Открыто

        [Повтор 48] Content Downloader X1 (Ultimate) – универсальный парсер

        Менеджер, 10 авг 2016, в разделе: Скрипты и программы
      4. Менеджер
        Открыто

        [Повтор 47] Content Downloader X1 (Ultimate) – универсальный парсер

        Менеджер, 14 июл 2016, в разделе: Скрипты и программы
      5. Менеджер
        Открыто

        [Повтор 46] Content Downloader X1 (Ultimate) – универсальный парсер

        Менеджер, 8 июн 2016, в разделе: Скрипты и программы
      6. Менеджер
        Открыто

        [Повтор 45] Content Downloader X1 (Ultimate) – универсальный парсер

        Менеджер, 28 апр 2016, в разделе: Скрипты и программы
      7. Менеджер
        Открыто

        [Повтор 44] Content Downloader X1 (Ultimate) – универсальный парсер

        Менеджер, 1 апр 2016, в разделе: Скрипты и программы