Skip to content

🌐 一、网页自动化介绍

1. 什么是网页自动化?

网页自动化(Web Automation)就是让电脑上的浏览器 代替人类去操作网页。 它能按照我们设定的步骤,自动完成“点击、输入、下载、采集”等动作。

👉 类比: 就像一个“虚拟助手”,帮你 打开网页 → 登录 → 搜索 → 下载 → 采集数据,而你不用盯着屏幕一直点。


2. 网页自动化能做什么?

🔑 (1)自动登录与操作

  • 自动输入账号、密码,点击登录。
  • 例子:每天早上自动登录 OA 系统,进入“公告栏”。

📊 (2)数据采集(爬取)

  • 从网页中提取文字、表格、图片、链接。
  • 例子:批量采集客户资料页面中的联系方式。

📥 (3)文件下载

  • 自动点击“导出 Excel / PDF”按钮。
  • 自动等待文件下载完成,并保存到指定文件夹。
  • 例子:每天定时下载财务报表。

📝 (4)表单填写与提交

  • 自动填写网页表单(输入姓名、地址、日期)。
  • 自动提交,避免重复手工输入。
  • 例子:批量录入客户信息、问卷调查。

🔄 (5)重复性任务批量化

  • 循环操作:对一批网址 / 数据逐个执行。
  • 例子:对 Excel 表里的一百个产品链接,逐个打开并抓取价格。

🛡️ (6)条件判断与流程控制

  • 判断网页是否出现“验证码 / 错误提示”。
  • 如果有,则暂停或切换方案。
  • 例子:检测到“登录失败”,就换账号重试。

🧩 (7)与其他工具联动

  • 网页 → 数据 → Excel → 邮件 / API。
  • 例子:采集订单 → 自动存到表格 → 再发邮件给业务员。

3. 为什么要用网页自动化?

  • 节省时间:重复的点击交给程序做。
  • 减少错误:机器不会漏点、输错。
  • 高效批量处理:同时完成几十、几百条任务。
  • 释放人力:让人做更有价值的分析,而不是机械操作。

4. 一个完整例子

比如财务小王:

  • 每天要 登录报表系统 → 输入日期 → 点击导出 → 下载 Excel → 保存到文件夹 → 发邮件给领导
  • 如果人工操作,需要 15 分钟。
  • 网页自动化设好后:
    • 每天早上 9:00 自动执行整个流程。
    • 小王只需要打开邮箱,就能看到最新的报表。
    • 节省时间 ×5,工作也更轻松。

✨ 总结: 网页自动化 ≠ 高深的编程,而是一个“虚拟助手”。 它能帮我们把 重复、枯燥、耗时的网页操作 → 全自动完成,让人专注在更重要的工作上。

🧩二、 网页自动化 vs 客户端 RPA 自动化

对比维度网页自动化客户端 RPA 自动化
操作对象只针对 网页(浏览器里的元素)涉及 整个电脑桌面(网页 + 本地软件 + 文件系统)
典型场景- 登录网站- 采集网页数据- 自动点击网页按钮- 提交表单- 操作 Excel、Word、ERP 软件- 拖动文件、复制粘贴- 打开本地客户端系统
实现方式基于 浏览器元素(DOM / XPath / Selector) 定位和操作基于 图像识别 / 元素识别 / API 调用 来模拟人类操作
学习门槛低,学点网页知识即可相对高,要理解桌面元素识别、流程编排
稳定性网页升级容易导致选择器失效本地软件升级或界面变化也可能失效
部署方式只需浏览器(Chrome、Edge 等)需要在电脑/服务器上安装 RPA 机器人软件
适合人群对网页重复操作多的岗位(客服、运营、财务、数据分析)需要整合 网页 + 桌面软件 + 文件 的企业级场景
成本门槛低,几乎人人可以使用较高,且需要 IT 支持

📌 简单理解

  • 网页自动化 = 浏览器里的“自动点人”。
  • 客户端 RPA = 整个电脑上的“虚拟员工”。

🎯 举个例子

财务小李的日常:

  1. 登录网站下载报表(网页自动化能做 ✅,客户端RPA 能 做✅)。
  2. 把下载的 Excel 打开,用公式汇总(客户端RPA 能自动打开 Excel 处理 ✅)。
  3. 把处理结果复制到 ERP 系统(客户端RPA 自动化能做 ✅,网页自动化能做 ✅)。

👉 所以:

  • 如果只是 “网页上的重复操作” → 用网页自动化 就够。
  • 如果涉及 跨软件、跨系统的流程 → 用 客户端RPA 更合适。

🧩三、 理论知识(必须)

1. 网页的组成(理论知识)

  • 网页 = 一张“房子蓝图”,里面有很多“积木块”。
  • 标签(Tag):积木的名字,比如 <div><input><button>。特点是 看不到,它是代码,隐藏在后面。
  • 元素(Element):网页上实际看到的按钮、输入框、文字,就是“元素”。

👉 业务例子

  • 登录页面里有一个“用户名输入框”和“登录按钮”,它们都是元素。
  • 报表下载页面里,一个“导出 Excel”按钮就是一个元素。

🖼️ 图示:

				┌─────────────────────┐
				│       网页           │
				│      (房子蓝图)       │
				└────────┬────────────┘
						 │
		  ┌──────────────┴───────────────┐
		  │                              │
	  标签(Tag)                     元素(Element)
  (看不见的积木名字)            (网页上实际看到的东西)
 ┌───────────────┐             ┌─────────────────┐
 │ <div>         │             │ 登录按钮         │
 │ <input>       │             │ 用户名输入框      │
 │ <button>      │             │ 导出 Excel 按钮  │
 └───────────────┘             └─────────────────┘

2. 定位元素(理论知识)

  • 为什么要定位? 人利用鼠标去点击网页上的元素,同样自动化工具需要知道“点哪里”,才能操作元素。
  • 元素选择器(Selector): 像快递地址,告诉自动化工具去找哪个元素。
    • 示例:#username → 找到“用户名输入框”
  • XPath(路径选择器): 像家谱,逐层描述元素的路径。
    • 示例://*[@class="download-btn"] → 找到“下载按钮”

💡 类比

方法类比
Selector快递地址:“北京市海淀区 ×× 路 101 号”
XPath家谱:爷爷(div) → 爸爸(form) → 孩子(input)

🖼️ 简易图示

网页元素 (按钮 / 输入框)


 ┌───────────────┐
 │ 自动化工具      │
 │ 定位元素地址    │
 │ Selector/XPath│
 └───────────────┘
网页元素 (按钮 / 输入框)


 ┌───────────────┐
 │ 自动化工具      │
 │ 定位元素地址    │
 │ Selector/XPath│
 └───────────────┘
[网页上的登录按钮] ──►  Selector: #login-btn
[网页上的用户名输入框] ──►  XPath: //*[@id="username"]
[网页上的登录按钮] ──►  Selector: #login-btn
[网页上的用户名输入框] ──►  XPath: //*[@id="username"]

3. 快速定位元素(实践)

在网页自动化中,手动写 Selector 或 XPath 有时很繁琐,尤其页面元素复杂时。为此,有一些工具可以快速定位元素,直接生成选择器或 XPath,提升效率。

3.1 常用工具

工具功能
浏览器开发者工具(Chrome DevTools)F12 打开 → 右键元素 → “Copy → Copy selector / Copy XPath”
自动化 IDE 内置录制器支持点击网页元素自动生成操作步骤和选择器
可视化选择器插件Browser Extension 插件(如 ChroPath、SelectorGadget)可直接点击元素,生成 Selector/XPath
AI 辅助工具一些智能辅助工具可分析网页结构,自动生成定位规则

3.2 使用流程示例(Chrome DevTools)

  1. 打开网页,按 F12 进入开发者工具
  2. 点击“元素”面板,选中目标元素
  3. 右键 → Copy → 选择 Copy selectorCopy XPath
  4. 粘贴到自动化脚本中,即可使用

💡 小技巧

  • 尽量使用 ID 或独特的 class,保证定位稳定
  • 对动态生成的元素,可结合 CSS 属性或层级路径优化 XPath

🖼️ 简易图示

[网页元素] ──► 右键 → Copy Selector/XPath ──► 自动生成定位地址 ──► 自动化脚本使用
[网页元素] ──► 右键 → Copy Selector/XPath ──► 自动生成定位地址 ──► 自动化脚本使用

4. 自动化工作流(理论知识)

4.1 什么是工作流?

  • 通俗理解:工作流就像流水线,把一个操作拆成多个步骤,让电脑按顺序自动完成。

  • 类比

    你做报表的流程:打开网页 → 输入账号 → 搜索数据 → 下载报表 工作流就把这几个步骤“装进机器里”,一次性自动完成。

4.2 工作流的核心组成

名称功能类比
节点(Node)每个操作的单元,如“点击按钮”“输入文字”“等待”流水线上的工位
连接线(Connector)节点之间的顺序关系流水线的传送带
触发器(Trigger)流程开始的条件,如“点击开始”或“定时”开关按钮
动作(Action)节点执行的具体操作,如“输入用户名”“下载文件”工人执行的具体任务

4.3 工作流程示例

[触发器:点击开始]


[节点1:打开网页]


[节点2:输入账号和密码]


[节点3:点击登录]


[节点4:搜索报表]


[节点5:点击下载]


[节点6:完成]
[触发器:点击开始]


[节点1:打开网页]


[节点2:输入账号和密码]


[节点3:点击登录]


[节点4:搜索报表]


[节点5:点击下载]


[节点6:完成]

4.4 重点提示

  • 工作流 = 自动化步骤的有序组合
  • 可以加循环、条件判断,让自动化更智能
  • 可复用:同一个流程可以多次执行,节省重复操作时间

💡 小结

网页自动化的工作流就像搭积木,每个节点是积木块,连接起来就是一条“自动操作流水线”,让电脑帮你做重复、繁琐的网页任务。

5.手动构建工作流(实践)

在 自动化工作流里,每个节点都是一个“动作”,动作由**指令(Action)**来执行。掌握核心指令,就能搭出各种自动化流程。

5.1 常用指令类别

类别指令示例功能类比
网页操作点击(Click)、输入文字(Type)、选择下拉框(Select)模拟人在网页上的操作鼠标点击、键盘输入
控制流程等待(Wait)、条件判断(If)、循环(Loop)、跳转(Go To)控制节点执行顺序和逻辑流水线的分岔、计时器
数据处理获取文本(Get Text)、设置变量(Set Variable)、保存文件(Download)处理网页数据或存储信息工人搬运、记录数据
触发/通知触发器(Trigger)、发送通知(Send Notification)、邮件/Slack启动流程或通知结果开关按钮、广播消息

5.2 核心指令(必须会用)

  1. 点击(Click)
    • 用于点击按钮、链接、复选框等
    • 示例:点击“登录”按钮
  2. 输入文字(Type)
    • 模拟键盘输入
    • 示例:输入用户名、密码、搜索关键字
  3. 等待(Wait)
    • 等待网页加载或操作完成
    • 示例:等待下载按钮出现,保证下载成功
  4. 获取数据(Get Text / Get Attribute)
    • 提取网页信息,用于判断或存储
    • 示例:获取报表标题、订单号
  5. 条件判断(If)
    • 根据某个条件决定下一步动作
    • 示例:如果“登录成功”,则进入下载流程,否则提示错误
  6. 循环(Loop)
    • 批量操作,重复执行节点
    • 示例:循环下载多页报表
  7. 变量(Set / Use Variable)
    • 存储和传递数据
    • 示例:把用户名存到变量,后续自动填充

5.3 小技巧

  • 先学网页操作和数据处理指令,快速搭建基础流程
  • 再学条件判断和循环,做复杂自动化
  • 善用变量,可以让流程更加灵活和智能

💡 总结

学会 网页自动化,就是构建 工作流 ,等于 会用核心指令 + 会组合节点 + 会控制流程顺序 核心指令像乐高积木,组合起来就能搭出各种自动化操作流水线。

6. 自动构建工作流(录制)

6.1 录制的作用

  • 类比 Excel 宏录制: 在 Excel 里,你可以“录制宏”,比如选中单元格 → 输入数据 → 格式化 → 保存。以后按一下按钮,这些操作就自动完成。
  • 网页自动化录制也是一样: 你在网页上点击、输入、下载等操作,工具会把这些步骤“录下来”,自动生成流程。

💡 核心点: 手动拖指令太慢,录制就像按下“录制宏”,一次性生成完整流程。

6.2 业务示例

  • 登录流程:点击输入框 → 输入账号 → 输入密码 → 点击登录
  • 搜索操作:点击搜索框 → 输入关键字 → 点击“搜索”
  • 下载报表:点击“导出” → 等待文件下载完成

6.3 图示

Excel 宏录制:
[点击单元格] → [输入数据] → [格式化] → [保存]


自动生成宏 → 以后直接执行

网页自动化 录制:
[点击网页元素] → [输入文字] → [点击按钮] → [下载文件]


自动生成节点流程 → 自动执行
Excel 宏录制:
[点击单元格] → [输入数据] → [格式化] → [保存]


自动生成宏 → 以后直接执行

网页自动化 录制:
[点击网页元素] → [输入文字] → [点击按钮] → [下载文件]


自动生成节点流程 → 自动执行

💡 小结

录制 = 快速生成流程节点 类比 Excel 宏录制,操作一次就自动生成自动化脚本,比手动拖节点快得多。


7. 高阶工作流(判断 / 循环)

7.1 核心概念

  • 串行:一步接一步,像流水线,操作按顺序执行
  • 分叉(条件判断 If):根据条件选择不同路径
  • 循环(Loop):重复执行同一个操作

💡 类比生活场景

  • If:如果下雨 → 打伞,否则 → 出门
  • Loop:每天早上刷牙 → 重复动作

7.2 业务示例

  • If(分叉)
    • 网页出现验证码 → 暂停
    • 否则 → 继续登录
  • Loop(循环)
    • 打开 10 个客户资料页 → 逐个下载 PDF
    • 逐行读取 Excel → 抓取每行数据

7.3 图示

串行(顺序执行):
[打开网页] → [输入账号] → [点击登录] → [下载报表]

分叉(If):
           ┌───────────是─────────┐
[检查验证码]                     [暂停]
           └──否─────────→ 继续登录

循环(Loop):
┌─────────────────────────┐
│ 读取每行数据 → 执行操作 │
└─────────↑──────────────┘
        重复
串行(顺序执行):
[打开网页] → [输入账号] → [点击登录] → [下载报表]

分叉(If):
           ┌───────────是─────────┐
[检查验证码]                     [暂停]
           └──否─────────→ 继续登录

循环(Loop):
┌─────────────────────────┐
│ 读取每行数据 → 执行操作 │
└─────────↑──────────────┘
        重复

💡 小结

工作流既可以串行执行,也可以分叉判断,或者循环重复,组合起来就能完成复杂自动化。


💡 四、指令集合

大类中文名称功能说明
interactionWeb交互操作网页上的元素,如点击、输入文字、选择下拉框
browser浏览器浏览器操作,如打开网页、刷新、关闭标签页
general通用一些通用操作,如发送通知、日志记录等
data数据数据处理相关,如获取文本、设置变量、下载文件
conditions控制流控制流程顺序与逻辑,如条件判断、循环、延迟等

1. Web交互(interaction) 🟩

操作网页上的元素。

  • Click(点击):点击按钮、链接、复选框等
  • Type(输入文字):在输入框或文本域输入内容
  • Select(选择下拉框):选择列表项
  • Check / Uncheck(勾选 / 取消勾选)
  • Focus(聚焦):让元素获得焦点
  • Scroll(滚动):滚动页面到指定位置
  • Hover(悬停):鼠标悬停在元素上

2. 浏览器(browser) 🟧

操作浏览器本身或标签页。

  • Open URL(打开网页)
  • Reload(刷新页面)
  • Go Back / Go Forward(前进 / 后退)
  • Close Tab / Close Window(关闭标签页 / 窗口)
  • New Tab(新建标签页)
  • Wait for Page Load(等待页面加载)

3. 通用(general) 🟥

通用操作,适用于多种场景。

  • Log(输出日志)
  • Send Notification(发送通知)
  • Execute Script(执行自定义 JS 脚本)
  • Delay / Wait(延迟操作)
  • Run Sub-Workflow(调用子工作流)

4. 数据(data) 🟨

获取、处理和存储数据。

  • Get Text(获取文本)
  • Get Attribute(获取属性值)
  • Set Variable(设置变量)
  • Use Variable(使用变量)
  • Download File(下载文件)
  • Parse JSON(解析 JSON 数据)

5. 控制流(conditions) 🟦

控制工作流的顺序、逻辑和循环。

  • If / Else(条件判断)
  • Loop / For Each(循环执行)
  • Switch / Case(多条件分支)
  • Wait(等待条件满足)
  • Stop / Break(停止流程 / 跳出循环)

✨ 五、专业术语

1、网页相关基础

中文English通俗解释示例
标签Tag网页的“积木名称”<input> 是输入框
元素Element页面上一个具体的部件登录按钮
属性Attribute元素的特征或参数<input type="text">
文本内容InnerText元素显示的文字“提交” 按钮上的字
选择器Selector定位元素的地址#login-btn
XPathXPath元素路径语言//*[@id="username"]
CSS选择器CSS Selector用 CSS 语法定位元素.btn-primary
DOMDOM (Document Object Model)网页结构树父节点=表单,子节点=输入框

2、基础概念

中文English通俗解释示例
工作流Workflow自动化流程自动登录并下载报表
节点Node流程中的步骤“打开网页”
触发器Trigger流程何时开始运行点击开始、定时运行
模块 / 方块Block节点的动作块“点击按钮”
录制Recording记录人工操作并转为流程录下搜索动作
运行Run启动工作流点击 ▶️
导入Import导入现成流程从文件导入模板
导出Export导出流程模板分享给同事

3、控制逻辑

中文English通俗解释示例
条件判断If / Else根据条件执行不同操作如果有验证码 → 停止
循环Loop重复执行操作批量打开网址
延迟Delay等待一段时间再执行等 2 秒再点击
等待元素Wait for element等待元素出现再操作等“登录按钮”加载
跳出循环Break提前结束循环找到目标后停止
跳过循环Continue跳过当前循环继续下一个跳过空数据

4、数据处理

中文English通俗解释示例
变量Variable存储临时数据的容器保存用户名
全局变量Global Variable在多个流程中都能用账号密码
数据集Dataset存储采集结果的表格保存商品价格
谷歌表格集成Google Sheet Integration将数据写入 Google 表格价格 → Google Sheet
CSV文件CSV File常见表格文件格式导出数据.csv
JSON文件JSON File常见数据格式接口返回的数据
正则表达式Regex (Regular Expression)文本模式匹配提取价格中的数字

5、常用动作节点

中文English通俗解释示例
打开新标签页Open new tab打开网页打开百度
点击元素Click element模拟鼠标点击点击“搜索”按钮
设置输入值Set value在输入框输入内容输入用户名
获取文本Get text抓取页面文字抓取标题
截图Screenshot截取网页画面保存首页截图
下载文件Download file自动保存文件下载报表
滚动页面Scroll向下滚动网页滚动到商品底部
日志Log输出调试信息打印变量值

6、进阶功能

中文English通俗解释示例
定时触发Schedule定时运行流程每天 9 点采集数据
API请求API Request请求外部接口获取天气数据
JavaScript函数JavaScript Function自定义代码特殊逻辑处理
条件分支Condition Block流程分岔A 页面点按钮1,B 页面点按钮2
错误处理Error Handling遇到错误时的处理方式找不到按钮时重试