The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"В Chrome началось тестирование третьей редакции манифеста, н..."
Версия для распечатки Пред. тема | След. тема
Форум Разговоры, обсуждение новостей
Исходное сообщение [ Отслеживать ]
Заметили полезную информацию ? Пожалуйста добавьте в FAQ на WIKI.
. "В Chrome началось тестирование третьей редакции манифеста, н..." –1 +/
Сообщение от jOKer (ok), 04-Ноя-19, 00:27 
Слушайте, вы можете конечно вешать лапшу хомячкам на уши, но я очень убедительно вас прошу не вешайте ее мне! Для того что бы спарсировать приемлемо страницу браузер _не нужен_!  Вполне достаточно специализированных библиотек. И любой программист, коего начальство заставляет парсить страницы конкурентов, об этом вам скажет. Кстати, библиотеки эти вам построят и DOM. Легко и не принужденно, между прочим. Хотите пример на питоне? Держите!

from bs4 import BeautifulSoup
html_doc = open('index.html').read()
soup = BeautifulSoup(html_doc, 'html.parser')
soup.find_all('a')

Так что жрать что дают будете как раз и только вы.  Приятного аппетита!

Ответить | Правка | Наверх | Cообщить модератору

Оглавление
В Chrome началось тестирование третьей редакции манифеста, н..., opennews, 03-Ноя-19, 11:50  [смотреть все]
Форумы | Темы | Пред. тема | След. тема



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру