Agenty的一个非常简单和高级的Web数据抓取扩展程序,可通过使用点击式CSS选择器从网站中提取数据以及实时提取的数据预览,并将数据快速导出到JSON / CSV / TSV中。
为Agenty云平台(https://www.agenty.com)创建免费的Web抓取代理,以进行大数据提取和更高级的Web抓取功能:如计划,匿名网站抓取,网站抓取,提取100或数百万个网页,提取多个网站同时发布,将数据发布到服务器等等
您可以创建的代理-
1.网页抓取代理
2.变更检测代理
3. Web爬网代理
如何使用
——————————–
1.转到要提取的网站,然后启动扩展程序。
2.在新建”下选择代理类型,或者您可以在我的代理下使用样本代理模板。
2.单击您要提取的网页元素(它将变为绿色)。然后,Web抓取应用程序将为该元素生成最佳的CSS选择器,并将突出显示(黄色)与该选择器匹配的所有内容。
3.现在,您可以单击突出显示的元素以将其从选择器中移除(红色),或单击未突出显示的元素以将其添加到提取器。通过选择和拒绝的过程,Web Scraping App将帮助您为需要提取的项目提供完美的CSS选择器。
4.使用TEXT,HTML或ATTR(属性)提取任意数量的字段,并即时输出提取数据的预览。
如何编辑您的网页抓取/更改检测代理
——————————-
1.转到创建代理的网站URL
2.启动Agenty扩展
3.单击代理旁边的打开按钮以在代理中将其打开。
4.现在,您可以添加/更改任何内容并将其保存回您的帐户。
特征
——————————–
1.从网页中提取任意数量的字段。
2.使用内置的CSS选择器一键生成图案。
3.编写自己的自定义CSS选择器。
4.选择要提取的项目。例如。 TEXT,HTML或ATTR(属性)
5.选择CSS选择器后,即可立即查看结果预览。
5.左右切换位置。
7.以最流行的文件格式JSON,CSV或TSV导出输出
最佳网页抓取工具
——————————–
首先是用于网站抓取的Jquery Style CSS选择器扩展。立即安装以使用最先进的屏幕抓取技术来解析HTML并免费从网站抓取/提取信息。例如。价格抓取,电子邮件抓取,数据抓取,隐藏的html标签抓取。
Web抓取也称为屏幕抓取,Web数据提取和Web收集等。
无论您是使用Agenty抓取网站还是使用C#,Python,Node JS,Perl,Ruby,Java或JavaScript编程语言中的API。您可以使用chrome扩展名生成用于Web抓取的Jquery样式CSS选择器。
查看更多详细信息:http://www.agenty.com