Windows 系统
方法1:用 curl
获取网页源码
- 安装 curl(若未安装):
- 下载地址:curl官方下载页
- 或通过 Chocolatey 安装:
choco install curl
- 打开命令提示符(CMD)或 PowerShell
- 输入命令:
curl https://www.example.com
- 添加
-v
参数查看详细请求过程(如响应头) - 使用
-o output.html
保存网页到本地文件
- 添加
方法2:用 Invoke-WebRequest
(PowerShell)
Invoke-WebRequest -Uri "https://www.example.com" -UseBasicParsing
- 添加
| Select-Object Content
仅显示网页内容 - 用
-OutFile page.html
保存网页
macOS 或 Linux 系统
方法1:curl 命令(系统内置)
curl -L https://www.example.com
-L
参数:自动跟随重定向链接-I
参数:仅显示HTTP头部信息
方法2:wget 命令(需安装)
wget https://www.example.com
- 下载网页到当前目录,文件名为
index.html
- 添加
-O custom.html
自定义保存文件名
高级用法:命令行浏览器
Lynx (文本浏览器)
- 安装:
- Ubuntu/Debian:
sudo apt install lynx
- macOS:
brew install lynx
- Ubuntu/Debian:
- 使用:
lynx https://www.example.com
- 方向键导航,
Q
键退出
- 方向键导航,
Headless Chrome (开发者工具)
通过Chrome命令行模式获取内容:
chrome --headless --dump-dom https://example.com
- 需提前安装Chrome浏览器
常见问题解决
-
提示
curl: command not found
→ 未安装curl,按上文步骤安装工具 -
网站返回 403 错误
→ 尝试添加用户代理模拟浏览器:curl -A "Mozilla/5.0" https://example.com
-
HTTPS证书错误
→ 临时忽略证书验证(慎用):curl -k https://example.com
重要提示
- 非用户日常浏览方式:命令行访问适合技术调试、自动化脚本或服务器环境,普通用户请使用图形浏览器(Chrome/Firefox等)。
- 安全风险:避免用
-k
参数访问敏感网站,可能暴露数据。 - 遵守网站规则:高频请求可能触发IP封禁,请参考
robots.txt
协议。
引用说明
本文命令参考自:
- curl 官方文档 (https://curl.se/docs/)
- Microsoft PowerShell 文档 (https://docs.microsoft.com/en-us/powershell/)
- GNU wget 手册 (https://www.gnu.org/software/wget/manual/)
操作需遵守目标网站服务条款,合法使用。
— 结束)
原创文章,发布者:酷番叔,转转请注明出处:https://cloud.kd.cn/ask/8133.html