莫度编程网

技术文章干货、编程学习教程与开发工具分享

只需3行代码,实现动态爬虫,

最简单的爬虫,又简化了,从4行变3行,你值得拥有!

运行环境:

  • Python3.10 及以上
  • 最新 Google 浏览器

安装依赖库

pip install DrissionPage

示例代码:

from DrissionPage import ChromiumPage

page = ChromiumPage()
# 打开百度官网
page.get('https://www.baidu.com')

执行成功后,会自动打开谷歌浏览器。并且访问百度官网。

只需3步,即可打开一个浏览器。比我之前的文章更加好,这可以动态爬取你想要的内容。

最简单的爬虫!只需要粘贴你要爬虫的网址

它获取定位元素,那是更加简单,只需要调用一行函数。

# 定位到账号文本框,获取文本框元素
ele = page.ele('#user_login')

快去试试吧!

更多信息

WebPage是功能最全面的页面类,既可控制浏览器,也可收发数据包:

from DrissionPage import WebPage

如果只要控制浏览器,导入ChromiumPage

from DrissionPage import ChromiumPage

如果只要收发数据包,导入SessionPage

from DrissionPage import SessionPage

如果你想要更多:参考 收发数据包 - DrissionPage

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言

    Powered By Z-BlogPHP 1.7.4

    蜀ICP备2024111239号-43