Appearance
🌐 一、网页自动化介绍
1. 什么是网页自动化?
网页自动化(Web Automation)就是让电脑上的浏览器 代替人类去操作网页。 它能按照我们设定的步骤,自动完成“点击、输入、下载、采集”等动作。
👉 类比: 就像一个“虚拟助手”,帮你 打开网页 → 登录 → 搜索 → 下载 → 采集数据,而你不用盯着屏幕一直点。
2. 网页自动化能做什么?
🔑 (1)自动登录与操作
- 自动输入账号、密码,点击登录。
- 例子:每天早上自动登录 OA 系统,进入“公告栏”。
📊 (2)数据采集(爬取)
- 从网页中提取文字、表格、图片、链接。
- 例子:批量采集客户资料页面中的联系方式。
📥 (3)文件下载
- 自动点击“导出 Excel / PDF”按钮。
- 自动等待文件下载完成,并保存到指定文件夹。
- 例子:每天定时下载财务报表。
📝 (4)表单填写与提交
- 自动填写网页表单(输入姓名、地址、日期)。
- 自动提交,避免重复手工输入。
- 例子:批量录入客户信息、问卷调查。
🔄 (5)重复性任务批量化
- 循环操作:对一批网址 / 数据逐个执行。
- 例子:对 Excel 表里的一百个产品链接,逐个打开并抓取价格。
🛡️ (6)条件判断与流程控制
- 判断网页是否出现“验证码 / 错误提示”。
- 如果有,则暂停或切换方案。
- 例子:检测到“登录失败”,就换账号重试。
🧩 (7)与其他工具联动
- 网页 → 数据 → Excel → 邮件 / API。
- 例子:采集订单 → 自动存到表格 → 再发邮件给业务员。
3. 为什么要用网页自动化?
- 节省时间:重复的点击交给程序做。
- 减少错误:机器不会漏点、输错。
- 高效批量处理:同时完成几十、几百条任务。
- 释放人力:让人做更有价值的分析,而不是机械操作。
4. 一个完整例子
比如财务小王:
- 每天要 登录报表系统 → 输入日期 → 点击导出 → 下载 Excel → 保存到文件夹 → 发邮件给领导。
- 如果人工操作,需要 15 分钟。
- 网页自动化设好后:
- 每天早上 9:00 自动执行整个流程。
- 小王只需要打开邮箱,就能看到最新的报表。
- 节省时间 ×5,工作也更轻松。
✨ 总结: 网页自动化 ≠ 高深的编程,而是一个“虚拟助手”。 它能帮我们把 重复、枯燥、耗时的网页操作 → 全自动完成,让人专注在更重要的工作上。
🧩二、 网页自动化 vs 客户端 RPA 自动化
| 对比维度 | 网页自动化 | 客户端 RPA 自动化 |
|---|---|---|
| 操作对象 | 只针对 网页(浏览器里的元素) | 涉及 整个电脑桌面(网页 + 本地软件 + 文件系统) |
| 典型场景 | - 登录网站- 采集网页数据- 自动点击网页按钮- 提交表单 | - 操作 Excel、Word、ERP 软件- 拖动文件、复制粘贴- 打开本地客户端系统 |
| 实现方式 | 基于 浏览器元素(DOM / XPath / Selector) 定位和操作 | 基于 图像识别 / 元素识别 / API 调用 来模拟人类操作 |
| 学习门槛 | 低,学点网页知识即可 | 相对高,要理解桌面元素识别、流程编排 |
| 稳定性 | 网页升级容易导致选择器失效 | 本地软件升级或界面变化也可能失效 |
| 部署方式 | 只需浏览器(Chrome、Edge 等) | 需要在电脑/服务器上安装 RPA 机器人软件 |
| 适合人群 | 对网页重复操作多的岗位(客服、运营、财务、数据分析) | 需要整合 网页 + 桌面软件 + 文件 的企业级场景 |
| 成本 | 门槛低,几乎人人可以使用 | 较高,且需要 IT 支持 |
📌 简单理解
- 网页自动化 = 浏览器里的“自动点人”。
- 客户端 RPA = 整个电脑上的“虚拟员工”。
🎯 举个例子
财务小李的日常:
- 登录网站下载报表(网页自动化能做 ✅,客户端RPA 能 做✅)。
- 把下载的 Excel 打开,用公式汇总(客户端RPA 能自动打开 Excel 处理 ✅)。
- 把处理结果复制到 ERP 系统(客户端RPA 自动化能做 ✅,网页自动化能做 ✅)。
👉 所以:
- 如果只是 “网页上的重复操作” → 用网页自动化 就够。
- 如果涉及 跨软件、跨系统的流程 → 用 客户端RPA 更合适。
🧩三、 理论知识(必须)
1. 网页的组成(理论知识)
- 网页 = 一张“房子蓝图”,里面有很多“积木块”。
- 标签(Tag):积木的名字,比如
<div>、<input>、<button>。特点是 看不到,它是代码,隐藏在后面。 - 元素(Element):网页上实际看到的按钮、输入框、文字,就是“元素”。
👉 业务例子:
- 登录页面里有一个“用户名输入框”和“登录按钮”,它们都是元素。
- 报表下载页面里,一个“导出 Excel”按钮就是一个元素。
🖼️ 图示:
┌─────────────────────┐
│ 网页 │
│ (房子蓝图) │
└────────┬────────────┘
│
┌──────────────┴───────────────┐
│ │
标签(Tag) 元素(Element)
(看不见的积木名字) (网页上实际看到的东西)
┌───────────────┐ ┌─────────────────┐
│ <div> │ │ 登录按钮 │
│ <input> │ │ 用户名输入框 │
│ <button> │ │ 导出 Excel 按钮 │
└───────────────┘ └─────────────────┘
2. 定位元素(理论知识)
- 为什么要定位? 人利用鼠标去点击网页上的元素,同样自动化工具需要知道“点哪里”,才能操作元素。
- 元素选择器(Selector): 像快递地址,告诉自动化工具去找哪个元素。
- 示例:
#username→ 找到“用户名输入框”
- 示例:
- XPath(路径选择器): 像家谱,逐层描述元素的路径。
- 示例:
//*[@class="download-btn"]→ 找到“下载按钮”
- 示例:
💡 类比:
| 方法 | 类比 |
|---|---|
| Selector | 快递地址:“北京市海淀区 ×× 路 101 号” |
| XPath | 家谱:爷爷(div) → 爸爸(form) → 孩子(input) |
🖼️ 简易图示:
网页元素 (按钮 / 输入框)
│
▼
┌───────────────┐
│ 自动化工具 │
│ 定位元素地址 │
│ Selector/XPath│
└───────────────┘网页元素 (按钮 / 输入框)
│
▼
┌───────────────┐
│ 自动化工具 │
│ 定位元素地址 │
│ Selector/XPath│
└───────────────┘[网页上的登录按钮] ──► Selector: #login-btn
[网页上的用户名输入框] ──► XPath: //*[@id="username"][网页上的登录按钮] ──► Selector: #login-btn
[网页上的用户名输入框] ──► XPath: //*[@id="username"]3. 快速定位元素(实践)
在网页自动化中,手动写 Selector 或 XPath 有时很繁琐,尤其页面元素复杂时。为此,有一些工具可以快速定位元素,直接生成选择器或 XPath,提升效率。
3.1 常用工具
| 工具 | 功能 |
|---|---|
| 浏览器开发者工具(Chrome DevTools) | F12 打开 → 右键元素 → “Copy → Copy selector / Copy XPath” |
| 自动化 IDE 内置录制器 | 支持点击网页元素自动生成操作步骤和选择器 |
| 可视化选择器插件 | Browser Extension 插件(如 ChroPath、SelectorGadget)可直接点击元素,生成 Selector/XPath |
| AI 辅助工具 | 一些智能辅助工具可分析网页结构,自动生成定位规则 |
3.2 使用流程示例(Chrome DevTools)
- 打开网页,按 F12 进入开发者工具
- 点击“元素”面板,选中目标元素
- 右键 →
Copy→ 选择Copy selector或Copy XPath - 粘贴到自动化脚本中,即可使用
💡 小技巧:
- 尽量使用
ID或独特的class,保证定位稳定 - 对动态生成的元素,可结合 CSS 属性或层级路径优化 XPath
🖼️ 简易图示:
[网页元素] ──► 右键 → Copy Selector/XPath ──► 自动生成定位地址 ──► 自动化脚本使用[网页元素] ──► 右键 → Copy Selector/XPath ──► 自动生成定位地址 ──► 自动化脚本使用4. 自动化工作流(理论知识)
4.1 什么是工作流?
通俗理解:工作流就像流水线,把一个操作拆成多个步骤,让电脑按顺序自动完成。
类比:
你做报表的流程:打开网页 → 输入账号 → 搜索数据 → 下载报表 工作流就把这几个步骤“装进机器里”,一次性自动完成。
4.2 工作流的核心组成
| 名称 | 功能 | 类比 |
|---|---|---|
| 节点(Node) | 每个操作的单元,如“点击按钮”“输入文字”“等待” | 流水线上的工位 |
| 连接线(Connector) | 节点之间的顺序关系 | 流水线的传送带 |
| 触发器(Trigger) | 流程开始的条件,如“点击开始”或“定时” | 开关按钮 |
| 动作(Action) | 节点执行的具体操作,如“输入用户名”“下载文件” | 工人执行的具体任务 |
4.3 工作流程示例
[触发器:点击开始]
│
▼
[节点1:打开网页]
│
▼
[节点2:输入账号和密码]
│
▼
[节点3:点击登录]
│
▼
[节点4:搜索报表]
│
▼
[节点5:点击下载]
│
▼
[节点6:完成][触发器:点击开始]
│
▼
[节点1:打开网页]
│
▼
[节点2:输入账号和密码]
│
▼
[节点3:点击登录]
│
▼
[节点4:搜索报表]
│
▼
[节点5:点击下载]
│
▼
[节点6:完成]4.4 重点提示
- 工作流 = 自动化步骤的有序组合
- 可以加循环、条件判断,让自动化更智能
- 可复用:同一个流程可以多次执行,节省重复操作时间
💡 小结:
网页自动化的工作流就像搭积木,每个节点是积木块,连接起来就是一条“自动操作流水线”,让电脑帮你做重复、繁琐的网页任务。
5.手动构建工作流(实践)
在 自动化工作流里,每个节点都是一个“动作”,动作由**指令(Action)**来执行。掌握核心指令,就能搭出各种自动化流程。
5.1 常用指令类别
| 类别 | 指令示例 | 功能 | 类比 |
|---|---|---|---|
| 网页操作 | 点击(Click)、输入文字(Type)、选择下拉框(Select) | 模拟人在网页上的操作 | 鼠标点击、键盘输入 |
| 控制流程 | 等待(Wait)、条件判断(If)、循环(Loop)、跳转(Go To) | 控制节点执行顺序和逻辑 | 流水线的分岔、计时器 |
| 数据处理 | 获取文本(Get Text)、设置变量(Set Variable)、保存文件(Download) | 处理网页数据或存储信息 | 工人搬运、记录数据 |
| 触发/通知 | 触发器(Trigger)、发送通知(Send Notification)、邮件/Slack | 启动流程或通知结果 | 开关按钮、广播消息 |
5.2 核心指令(必须会用)
- 点击(Click)
- 用于点击按钮、链接、复选框等
- 示例:点击“登录”按钮
- 输入文字(Type)
- 模拟键盘输入
- 示例:输入用户名、密码、搜索关键字
- 等待(Wait)
- 等待网页加载或操作完成
- 示例:等待下载按钮出现,保证下载成功
- 获取数据(Get Text / Get Attribute)
- 提取网页信息,用于判断或存储
- 示例:获取报表标题、订单号
- 条件判断(If)
- 根据某个条件决定下一步动作
- 示例:如果“登录成功”,则进入下载流程,否则提示错误
- 循环(Loop)
- 批量操作,重复执行节点
- 示例:循环下载多页报表
- 变量(Set / Use Variable)
- 存储和传递数据
- 示例:把用户名存到变量,后续自动填充
5.3 小技巧
- 先学网页操作和数据处理指令,快速搭建基础流程
- 再学条件判断和循环,做复杂自动化
- 善用变量,可以让流程更加灵活和智能
💡 总结:
学会 网页自动化,就是构建 工作流 ,等于 会用核心指令 + 会组合节点 + 会控制流程顺序 核心指令像乐高积木,组合起来就能搭出各种自动化操作流水线。
6. 自动构建工作流(录制)
6.1 录制的作用
- 类比 Excel 宏录制: 在 Excel 里,你可以“录制宏”,比如选中单元格 → 输入数据 → 格式化 → 保存。以后按一下按钮,这些操作就自动完成。
- 网页自动化录制也是一样: 你在网页上点击、输入、下载等操作,工具会把这些步骤“录下来”,自动生成流程。
💡 核心点: 手动拖指令太慢,录制就像按下“录制宏”,一次性生成完整流程。
6.2 业务示例
- 登录流程:点击输入框 → 输入账号 → 输入密码 → 点击登录
- 搜索操作:点击搜索框 → 输入关键字 → 点击“搜索”
- 下载报表:点击“导出” → 等待文件下载完成
6.3 图示
Excel 宏录制:
[点击单元格] → [输入数据] → [格式化] → [保存]
│
▼
自动生成宏 → 以后直接执行
网页自动化 录制:
[点击网页元素] → [输入文字] → [点击按钮] → [下载文件]
│
▼
自动生成节点流程 → 自动执行Excel 宏录制:
[点击单元格] → [输入数据] → [格式化] → [保存]
│
▼
自动生成宏 → 以后直接执行
网页自动化 录制:
[点击网页元素] → [输入文字] → [点击按钮] → [下载文件]
│
▼
自动生成节点流程 → 自动执行💡 小结:
录制 = 快速生成流程节点 类比 Excel 宏录制,操作一次就自动生成自动化脚本,比手动拖节点快得多。
7. 高阶工作流(判断 / 循环)
7.1 核心概念
- 串行:一步接一步,像流水线,操作按顺序执行
- 分叉(条件判断 If):根据条件选择不同路径
- 循环(Loop):重复执行同一个操作
💡 类比生活场景
- If:如果下雨 → 打伞,否则 → 出门
- Loop:每天早上刷牙 → 重复动作
7.2 业务示例
- If(分叉)
- 网页出现验证码 → 暂停
- 否则 → 继续登录
- Loop(循环)
- 打开 10 个客户资料页 → 逐个下载 PDF
- 逐行读取 Excel → 抓取每行数据
7.3 图示
串行(顺序执行):
[打开网页] → [输入账号] → [点击登录] → [下载报表]
分叉(If):
┌───────────是─────────┐
[检查验证码] [暂停]
└──否─────────→ 继续登录
循环(Loop):
┌─────────────────────────┐
│ 读取每行数据 → 执行操作 │
└─────────↑──────────────┘
重复串行(顺序执行):
[打开网页] → [输入账号] → [点击登录] → [下载报表]
分叉(If):
┌───────────是─────────┐
[检查验证码] [暂停]
└──否─────────→ 继续登录
循环(Loop):
┌─────────────────────────┐
│ 读取每行数据 → 执行操作 │
└─────────↑──────────────┘
重复💡 小结:
工作流既可以串行执行,也可以分叉判断,或者循环重复,组合起来就能完成复杂自动化。
💡 四、指令集合
| 大类 | 中文名称 | 功能说明 |
|---|---|---|
| interaction | Web交互 | 操作网页上的元素,如点击、输入文字、选择下拉框 |
| browser | 浏览器 | 浏览器操作,如打开网页、刷新、关闭标签页 |
| general | 通用 | 一些通用操作,如发送通知、日志记录等 |
| data | 数据 | 数据处理相关,如获取文本、设置变量、下载文件 |
| conditions | 控制流 | 控制流程顺序与逻辑,如条件判断、循环、延迟等 |
1. Web交互(interaction) 🟩
操作网页上的元素。
- Click(点击):点击按钮、链接、复选框等
- Type(输入文字):在输入框或文本域输入内容
- Select(选择下拉框):选择列表项
- Check / Uncheck(勾选 / 取消勾选)
- Focus(聚焦):让元素获得焦点
- Scroll(滚动):滚动页面到指定位置
- Hover(悬停):鼠标悬停在元素上
2. 浏览器(browser) 🟧
操作浏览器本身或标签页。
- Open URL(打开网页)
- Reload(刷新页面)
- Go Back / Go Forward(前进 / 后退)
- Close Tab / Close Window(关闭标签页 / 窗口)
- New Tab(新建标签页)
- Wait for Page Load(等待页面加载)
3. 通用(general) 🟥
通用操作,适用于多种场景。
- Log(输出日志)
- Send Notification(发送通知)
- Execute Script(执行自定义 JS 脚本)
- Delay / Wait(延迟操作)
- Run Sub-Workflow(调用子工作流)
4. 数据(data) 🟨
获取、处理和存储数据。
- Get Text(获取文本)
- Get Attribute(获取属性值)
- Set Variable(设置变量)
- Use Variable(使用变量)
- Download File(下载文件)
- Parse JSON(解析 JSON 数据)
5. 控制流(conditions) 🟦
控制工作流的顺序、逻辑和循环。
- If / Else(条件判断)
- Loop / For Each(循环执行)
- Switch / Case(多条件分支)
- Wait(等待条件满足)
- Stop / Break(停止流程 / 跳出循环)
✨ 五、专业术语
1、网页相关基础
| 中文 | English | 通俗解释 | 示例 |
|---|---|---|---|
| 标签 | Tag | 网页的“积木名称” | <input> 是输入框 |
| 元素 | Element | 页面上一个具体的部件 | 登录按钮 |
| 属性 | Attribute | 元素的特征或参数 | <input type="text"> |
| 文本内容 | InnerText | 元素显示的文字 | “提交” 按钮上的字 |
| 选择器 | Selector | 定位元素的地址 | #login-btn |
| XPath | XPath | 元素路径语言 | //*[@id="username"] |
| CSS选择器 | CSS Selector | 用 CSS 语法定位元素 | .btn-primary |
| DOM | DOM (Document Object Model) | 网页结构树 | 父节点=表单,子节点=输入框 |
2、基础概念
| 中文 | English | 通俗解释 | 示例 |
|---|---|---|---|
| 工作流 | Workflow | 自动化流程 | 自动登录并下载报表 |
| 节点 | Node | 流程中的步骤 | “打开网页” |
| 触发器 | Trigger | 流程何时开始运行 | 点击开始、定时运行 |
| 模块 / 方块 | Block | 节点的动作块 | “点击按钮” |
| 录制 | Recording | 记录人工操作并转为流程 | 录下搜索动作 |
| 运行 | Run | 启动工作流 | 点击 ▶️ |
| 导入 | Import | 导入现成流程 | 从文件导入模板 |
| 导出 | Export | 导出流程模板 | 分享给同事 |
3、控制逻辑
| 中文 | English | 通俗解释 | 示例 |
|---|---|---|---|
| 条件判断 | If / Else | 根据条件执行不同操作 | 如果有验证码 → 停止 |
| 循环 | Loop | 重复执行操作 | 批量打开网址 |
| 延迟 | Delay | 等待一段时间再执行 | 等 2 秒再点击 |
| 等待元素 | Wait for element | 等待元素出现再操作 | 等“登录按钮”加载 |
| 跳出循环 | Break | 提前结束循环 | 找到目标后停止 |
| 跳过循环 | Continue | 跳过当前循环继续下一个 | 跳过空数据 |
4、数据处理
| 中文 | English | 通俗解释 | 示例 |
|---|---|---|---|
| 变量 | Variable | 存储临时数据的容器 | 保存用户名 |
| 全局变量 | Global Variable | 在多个流程中都能用 | 账号密码 |
| 数据集 | Dataset | 存储采集结果的表格 | 保存商品价格 |
| 谷歌表格集成 | Google Sheet Integration | 将数据写入 Google 表格 | 价格 → Google Sheet |
| CSV文件 | CSV File | 常见表格文件格式 | 导出数据.csv |
| JSON文件 | JSON File | 常见数据格式 | 接口返回的数据 |
| 正则表达式 | Regex (Regular Expression) | 文本模式匹配 | 提取价格中的数字 |
5、常用动作节点
| 中文 | English | 通俗解释 | 示例 |
|---|---|---|---|
| 打开新标签页 | Open new tab | 打开网页 | 打开百度 |
| 点击元素 | Click element | 模拟鼠标点击 | 点击“搜索”按钮 |
| 设置输入值 | Set value | 在输入框输入内容 | 输入用户名 |
| 获取文本 | Get text | 抓取页面文字 | 抓取标题 |
| 截图 | Screenshot | 截取网页画面 | 保存首页截图 |
| 下载文件 | Download file | 自动保存文件 | 下载报表 |
| 滚动页面 | Scroll | 向下滚动网页 | 滚动到商品底部 |
| 日志 | Log | 输出调试信息 | 打印变量值 |
6、进阶功能
| 中文 | English | 通俗解释 | 示例 |
|---|---|---|---|
| 定时触发 | Schedule | 定时运行流程 | 每天 9 点采集数据 |
| API请求 | API Request | 请求外部接口 | 获取天气数据 |
| JavaScript函数 | JavaScript Function | 自定义代码 | 特殊逻辑处理 |
| 条件分支 | Condition Block | 流程分岔 | A 页面点按钮1,B 页面点按钮2 |
| 错误处理 | Error Handling | 遇到错误时的处理方式 | 找不到按钮时重试 |
MakAgent在线文档