快速搭建(不适用于生产环境)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
# 安装服务端
git clone https://github.com/ccfos/nightingale.git
cd docker
docker-compose up -d

# 转移初始化sql目录
mv initsql ../

# 浏览器访问
IP:18000
username = "root"
password = "root.2020"

# 生产环境适用于二进制或者集群部署;存储可以默认使用的Prometheus,也可以考虑换成VictoriaMetrics或者Thanos

安装客户端

官网地址:

github: https://github.com/flashcatcloud/categraf
gitlink: https://www.gitlink.org.cn/flashcat/categraf

1
2
3
4
5
6
7
# 安装 Categraf 采集器
wget https://github.com/flashcatcloud/categraf/releases/download/v0.1.11/categraf-v0.1.11-linux-amd64.tar.gz

# 修改 conf/config.toml 中的 writer 地址为你的环境的地址 (IP地址)

# 启动
nohup ./categraf &> stdout.log &

配置告警

配置着重注意的一些指标(快捷视图上检索)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
# CPU使用率(单位:%)
cpu_usage_active

# 硬盘分区使用率(单位:%)
disk_used_percent

# 内存剩余百分比(0~100)
mem_available_percent

# 5分钟平均load值 (超过10就可以考虑报警了)
system_load5

# 文件句柄数 (与最大值做对比,做出合理阈值报警)
linux_sysctl_fs_file_nr

# 文件句柄数最大值
linux_sysctl_fs_file_max