Wang's blog Wang's blog
首页
  • 前端文章

    • HTML教程
    • CSS
    • JavaScript
  • 前端框架

    • Vue
    • React
    • VuePress
    • Electron
  • 后端技术

    • Npm
    • Node
    • TypeScript
  • 编程规范

    • 规范
  • 我的笔记
  • Git
  • GitHub
  • VSCode
  • Mac工具
  • 数据库
  • Google
  • 服务器
  • Python爬虫
  • 前端教程
更多
收藏
关于
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

Wang Mings

跟随大神,成为大神!
首页
  • 前端文章

    • HTML教程
    • CSS
    • JavaScript
  • 前端框架

    • Vue
    • React
    • VuePress
    • Electron
  • 后端技术

    • Npm
    • Node
    • TypeScript
  • 编程规范

    • 规范
  • 我的笔记
  • Git
  • GitHub
  • VSCode
  • Mac工具
  • 数据库
  • Google
  • 服务器
  • Python爬虫
  • 前端教程
更多
收藏
关于
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • Go

    • 基础库

    • 第三方库

      • cron库简介
      • colly库简介
        • colly库简介
        • 项目地址
        • 安装
        • 引用
        • 源码解读
          • 支持类型
      • gjson库简介
  • MD

  • Git

  • Image

  • GitHub

  • Google

  • VSCode

  • Mac工具

  • 数据库

  • 服务器

  • 工具
  • Go
  • 第三方库
wangmings
2022-07-19
目录

colly库简介

# colly库简介

Colly是一个用于构建Web scraper的Golang框架。使用Colly,您可以构建各种复杂的Web scraper,从简单的scraper到处理数百万个Web页面的复杂异步网站爬虫。 Colly提供用于执行网络请求和处理所接收内容的API(例如,与HTML文档的DOM树交互)。

# 项目地址

gocolly/colly: Elegant Scraper and Crawler Framework for Golang (github.com) (opens new window)

# 安装

官网上说使用go get -u github.com/gocolly/colly但坑爹的是这玩意下载的版本是1.2.0

亲测应该使用go get -u github.com/gocolly/colly/v2

# 引用

github.com/gocolly/colly/v2

还是那样子,按官网来的话得到的是1.2.0的版本

以上坑爹的经验时间来自于2022/02/22版本号为2.1.0,至于未来是否改变自行测试

# 源码解读

# 支持类型

  • OnRequest 请求执行前调用
  • OnResponse 响应返回之后调用
  • OnHTML 监听执行selector
  • OnXML 监听执行selector
  • OnHTMLDetach 取消监听,参数为selector字符串
  • OnXMLDetach 取消监听,参数为selector字符串
  • OnScraped 完成抓取后执行,完成所有工作后执行
  • OnError 错误回调
  • Visit 正式启动访问
编辑 (opens new window)
cron库简介
gjson库简介

← cron库简介 gjson库简介→

最近更新
01
theme-vdoing-blog博客静态编译问题
09-16
02
搜索引擎
07-19
03
友情链接
07-19
更多文章>
Theme by Vdoing | Copyright © 2019-2022 Evan Xu | MIT License
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式