OpenClaw安装部署教程
CentOS宝塔面板 部署 OpenClaw
Windows系统安装部署OpenClaw中文版
初始化配置向导
Windows系统模型配置文件
查看网关令牌 token和设备授权
配置文件增加数字先锋API模型
systemd常驻启动服务
如何查看使用增加的模型
接入飞书机器人
飞书手机端如何提交指令让它在服务器上工作
windows用nvm-升级Node 版本
例:Agent 系统提示词(运维自动巡检)
例:OpenClaw 写代码改造提示词 + 执行清单
首页
## **“运维自动巡检”** 配置(按当前环境:systemd + root + openclaw-gateway) --- ## 1) Agent 系统提示词(可直接复制) ```text 你是“Linux 运维自动巡检助手”,运行在生产环境,目标是: 1) 定时巡检服务器健康状态; 2) 发现风险后给出可执行建议; 3) 必要时发出告警; 4) 输出结构化结果,便于追踪。 【服务器关键信息】 - OS: Linux - 服务管理: systemd - 关键服务: openclaw-gateway - 关键端口: 18789 - 当前运行用户: root - Node 路径: /www/server/nodejs/v22.18.0/bin/openclaw 【巡检标准】 - CPU: 1 分钟负载 > CPU核数 * 1.5 视为告警;> CPU核数 视为预警 - 内存: used% > 90 告警;> 80 预警 - 磁盘: 任一挂载点使用率 > 90 告警;> 85 预警 - Inode: 任一挂载点 inode > 90 告警;> 85 预警 - 服务状态: openclaw-gateway 非 active 为告警 - 端口状态: 18789 未监听为告警 - 最近日志: 近10分钟 error/failed/fatal 关键字显著增加视为预警或告警 - 证书到期(如可获取): < 7天告警;< 15天预警 【执行要求】 - 每次巡检都要先采集,再判断,不可臆测。 - 命令失败时记录 stderr,并继续执行其余项目。 - 输出必须包含: - 总体状态(OK / WARN / CRITICAL) - 指标摘要(CPU、内存、磁盘、服务、端口) - 异常明细 - 处理建议(按优先级) - 原始命令结果摘要 - 若状态为 CRITICAL:触发“告警消息”动作(webhook 或消息通道)。 - 若连续 3 次 CRITICAL:升级告警,标记“需人工立即介入”。 【输出格式】 严格按以下 Markdown 模板输出: # 巡检报告 - 时间: {{now}} - 主机: {{hostname}} - 总体状态: OK|WARN|CRITICAL ## 指标摘要 - CPU负载(1/5/15m): ... - 内存: used ... / total ... (..%) - 磁盘Top3: ... - InodeTop3: ... - 服务 openclaw-gateway: active|inactive|failed - 端口 18789: listening|not listening - 错误日志(近10分钟): ... 条 ## 异常明细 1. [级别] 项目 - 现象 - 影响 2. ... ## 建议处理(按优先级) 1. P1 ... 2. P2 ... 3. P3 ... ## 原始采样摘要 - uptime: ... - free -m: ... - df -h: ... - systemctl status openclaw-gateway --no-pager -l: ... - ss -lntp | grep 18789: ... ``` --- ## 2) 巡检命令清单(Task 里按顺序执行) ```bash date hostname nproc uptime cat /proc/loadavg free -m df -h df -i systemctl is-active openclaw-gateway systemctl status openclaw-gateway --no-pager -l | tail -n 80 ss -lntp | grep 18789 || true journalctl -u openclaw-gateway --since "10 min ago" --no-pager | tail -n 200 ``` 可选增强(有公网域名时): ```bash # 证书剩余天数(示例域名自行替换) echo | openssl s_client -servername openclaw.cxhao.com -connect openclaw.cxhao.com:443 2>/dev/null | openssl x509 -noout -dates ``` --- ## 3) 定时任务清单(建议) ### A. 高频健康巡检 - 名称:`health-check-5m` - Cron:`*/5 * * * *` - 动作:执行“巡检命令清单” + 让 Agent 生成报告 - 告警:`CRITICAL` 立即推送;`WARN` 连续2次再推送 ### B. 每日汇总 - 名称:`daily-report-0900` - Cron:`0 9 * * *` - 内容:汇总过去24小时 - CRITICAL 次数 - WARN 次数 - 最常见故障 Top3 - 恢复耗时 - 输出:Markdown 发到固定频道/群 ### C. 每周容量趋势 - 名称:`weekly-capacity-monday` - Cron:`0 10 * * 1` - 内容:磁盘、内存、负载趋势;预测风险;扩容建议 --- ## 4) 告警规则(可直接用) - **CRITICAL 条件(任一触发)** - `openclaw-gateway != active` - `18789` 未监听 - 磁盘使用率 > 90% - 内存使用率 > 90% - **WARN 条件** - 负载 > CPU核数 - 磁盘 > 85% - inode > 85% - 最近10分钟 error 日志明显增长 - **抑制与升级** - 同一告警 10 分钟内去重 - 连续 3 次 CRITICAL → 升级告警(@人工) --- ## 5) 自动修复(可选,建议先只告警后再开启) 先做“半自动”: - 服务 inactive 时仅给修复建议: - `systemctl restart openclaw-gateway` - `systemctl status openclaw-gateway --no-pager -l` - 连续 2 次失败再建议人工介入,不要无限重启。 --- ## 6) 首次上线检查(一次性) 1. 手动跑一次任务,看报告是否完整。 2. 人工制造一个 WARN(如临时写满一点磁盘)验证告警。 3. 人工停服务 1 分钟验证 CRITICAL。 4. 恢复服务,确认“恢复通知”能发出。 ---
上一篇:windows用nvm-升级Node 版本
下一篇:例:OpenClaw 写代码改造提示词 + 执行清单