神箭手客户端以其卓越的数据可视化功能引领用户轻松点选所需网页页面数据信息,并自动生成高效的爬虫编码。另外该客户端还显著提升了文档导出速率,支持批量导出全部数据信息,极大地提高了工作效率。
打开已安装的神箭手客户端。
输入神箭手账户和密码,登录至控制面板。
点击“新建应用”>选择“爬虫”>点击“下一步”。
选择“自定义开发”>选择“点选方式”。
输入爬虫名称,点击“创建”。
启动创建的爬虫,进入点选控制面板。
在点选控制面板中,进行点选操作。
首先输入包含所需数据信息的URL(例如:https://www.leiphone.com/news/201712/WxtDEEQEXXDZLYev.html),按回车键加载显示内容。
随后在显示的网页页面中,点击选择要收集的数据信息,例如收集文章的标题和内容。
点击左侧的高级设置,可以设置爬虫的目录页、内容页URL正则表达式、是否自动JS渲染等,以提升爬虫效率。
点选完成后点击“开始抓取”。
稍等片刻爬虫将自动运行,完成数据抓取。