Wang's blog Wang's blog
首页
  • 前端文章

    • HTML教程
    • CSS
    • JavaScript
  • 前端框架

    • Vue
    • React
    • VuePress
    • Electron
  • 后端技术

    • Npm
    • Node
    • TypeScript
  • 编程规范

    • 规范
  • 我的笔记
  • Git
  • GitHub
  • VSCode
  • Mac工具
  • 数据库
  • Google
  • 服务器
  • Python爬虫
  • 前端教程
更多
收藏
关于
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

Wang Mings

跟随大神,成为大神!
首页
  • 前端文章

    • HTML教程
    • CSS
    • JavaScript
  • 前端框架

    • Vue
    • React
    • VuePress
    • Electron
  • 后端技术

    • Npm
    • Node
    • TypeScript
  • 编程规范

    • 规范
  • 我的笔记
  • Git
  • GitHub
  • VSCode
  • Mac工具
  • 数据库
  • Google
  • 服务器
  • Python爬虫
  • 前端教程
更多
收藏
关于
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • Python爬虫

    • 爬虫的基础知识

    • 请求的发送方法

    • 数据提取方法

    • 高性能爬虫

    • selenium

      • 无头浏览器的介绍
      • selenium的基本使用
        • selenium的基本使用
          • 学习目标
          • 1 加载网页:
          • 2 定位和操作:
          • 3 查看请求信息:
          • 4 退出
          • 5 练习
          • 小结
      • selenium元素定位的方法
      • selenium的其他方法
      • selenium案例
      • 小结
    • 反爬以及解决方案

    • MONGODB数据库

    • scrapy框架

    • scrapy_redis

    • 爬虫的部署

    • 爬虫框架开发分析

    • 框架雏形实现

    • 框架功能完善

    • 框架功能升级

    • 项目实战

    • pywin32介绍

  • 前端教程

  • 教程
  • Python爬虫
  • selenium
wangmings
2022-07-19
目录

selenium的基本使用

# selenium的基本使用

# 学习目标
  1. 掌握 selenium发送请求,加载网页的方法
  2. 掌握 selenium简单的元素定位的方法
  3. 掌握 selenium的基础属性和方法
  4. 掌握 selenium退出的方法

当我们安装完毕无界面浏览器之后, 再学习下 selenium中drvier的使用操作

# 1 加载网页:

selenium通过控制浏览器,所以对应的获取的数据都是elements中的内容


from selenium import webdriver 
# 指定driver的绝对路径
# driver = webdriver.PhantomJS(executable_path='/home/worker/Desktop/driver/phantomjs') 
driver = webdriver.Chrome(executable_path='/home/worker/Desktop/driver/chromedriver')
# 向一个url发起请求
driver.get("http://www.itcast.cn/")
# 把网页保存为图片
driver.save_screenshot("itcast.png")
# 退出模拟浏览器
driver.quit() # 一定要退出!不退出会有残留进程!
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14

# 2 定位和操作:

以百度搜索为例


import time
from selenium import webdriver

driver = webdriver.Chrome(executable_path='/home/worker/Desktop/driver/chromedriver')
driver.get("https://www.baidu.com/")

driver.find_element_by_id('kw').send_keys('python')
driver.find_element_by_id('su').click()

time.sleep(6)
driver.quit()
 
1
2
3
4
5
6
7
8
9
10
11
12
13

# 3 查看请求信息:


driver.page_source # 查看网页源码
driver.get_cookies() # # 获取当前浏览器的全部cookies
driver.current_url # 获取当前页面的url
 
1
2
3
4
5

# 4 退出


driver.close() #退出当前页面
driver.quit()  #退出浏览器
 
1
2
3
4

# 5 练习

模拟百度搜索‘传智播客’


# 小结

  1. selenium的导包:from selenium import webdriver
  2. selenium创建driver对象:webdriver.PhantomJS()
  3. selenium请求数据:driver.get("http://www.baidu.com/")
  4. selenium查看数据: driver.page_source
  5. 关闭无界面浏览器: driver.quit()
  6. 根据id定位元素: driver.find_element_by_id(“kw”)
  7. 操作点击事件: click()
  8. 给输入框赋值:send_keys()
编辑 (opens new window)
无头浏览器的介绍
selenium元素定位的方法

← 无头浏览器的介绍 selenium元素定位的方法→

最近更新
01
theme-vdoing-blog博客静态编译问题
09-16
02
搜索引擎
07-19
03
友情链接
07-19
更多文章>
Theme by Vdoing | Copyright © 2019-2022 Evan Xu | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式