如果是单纯的运行一个node进程,那会比较简单,例如:
node ./example.js
但是一般来说,当我们运行一个node进程之后,我们可能希望对这个进程进行更多的管理,例如,当node程序是一个server服务时,我们就有更多的需求。
例如:
1.服务挂掉的时候自动重启。
2.列出所有服务,包括服务的信息。
3.能够重启/终止某个服务。
4.为服务的运行记录日志。
1.服务挂掉的时候自动重启。
对于这个需求,我们需要做的是把服务进程当做一个子进程来运行,当子进程不幸挂了,父进程将其重启,例如:
var spawn = require('child_process').spawn;var cp = spawn(process.execPath,['./example.js']);cp.on('exit',function(){ //restart});
假设父进程程序名为pro_a,那么通过父进程启动一个子程序会是这样:
pro_a ./example.js
传入子程序名,由父程序执行。
这样相当于pro_a程序管理子程序的执行:
2.列出所有服务,包括服务的信息。
假设我们执行example.js之后,还有多个程序需要执行,每个程序都使用pro_a程序来启动:
pro_a ./example.jspro_a ./server.jspro_a ./other.js
情况变成这样:
如上图,多个pro_a进程对应开启的多个不同子程序的进程。
这时候问题来了,我们希望知道所有用pro_a启动的子进程的进程信息,要怎么做呢?
例如:
pro_a -l //列出所有子进程信息
这时候需求就转变成:新的pro_a进程需要和其他pro_a进程通信,并获取其他pro_a进程运行的子进程的信息。
对于UNIX的跨进程通信,有几种方式,由于这里不同进程在同一个机器中,因此我们这里采用UNIX domain socket的方式(不用经过网卡),让在不同pro_a进程间进行通信。
使用这种方式,我们需要做的是pro_a进程每次创建子进程的时候,启用一个server,并监听对应的sock文件,那么当心的pro_a进程启动之后,就可以通过遍历所有sock文件并对有效sock文件进行连接,从而能够和不同pro_a进程之间进行消息的通信。
例如:
创建子进程的pro_a:
var net = require('net'); //使用UNIX domain socketvar server = net.createServer(function(socket){ socket.setEncoding('UTF8'); socket.on('data',function(){ //收到消息后,向请求方发送子进程相关信息 socket.write(JSON.stringify({ pid:child_process.pid //... })); });});server.listen(socketPath + 'resume_' + Date.now() + '.sock');
这样每个pro_a进程创建子进程之后,都会对应产生一个sock文件:
对于新的pro_a进程,第一步是获取所有sock文件,并进行连接:
var getAllSocketFiles = function(){ var socketFiles; try{ socketFiles = fs.readdirSync(socketPath); } catch(ex){ if(ex.code == 'ENOENT'){ fs.mkdirSync(socketPath); } socketFiles = fs.readdirSync(socketPath); } return socketFiles;};
针对每个sock文件,创建socket进行连接,并发送消息请求:
var socket = new net.Socket();socket.setEncoding('UTF8');socket.connect(this.socketName,function(){ socket.write(JSON.stringify({ //请求对应的子进程信息 }))});socket.on('data',function(){ data = JSON.parse(data); //获得对应子进程信息});
这样pro_a进程就能从其他pro_进程中获取到信息。
3.能够重启/终止某个服务。
由于我们设置了子程序在挂掉后会自动重启,因此我们需要增加一个命令让程序在需要时能正常关闭,例如:
pro_a -s 1140 //强制终止掉进程号为1140的子进程
此时该pro_a进程需要连接所有其他pro_a进程并获取他们的子进程信息(就像上面-l那样),然后筛选出pid未1140的子进程,再次通过socket发送关闭指令,对应的server接收到关闭指令后把其子进程kill掉。
4.为服务的运行记录日志。
这个只需要pro_a监听子进程的事件,并实时写入log文件就ok了。并且我们可以通过命令让心的pro_a进程能够查看某个其他pro_a进程中子进程的log,例如:
pro_a -L 1130 // 查看1130的子进程的log
原理和3相似,获取所有pro_a进程信息,筛选出pid为1130的子进程,socket发送获取log的指令,对应server把log信息返回。
我把以上pro_a的功能以及更多其他功能封装成一个叫Resume.js的程序放倒github上,有兴趣的同学可以看看:
其中包含了上面功能的实现源码。我们可以通过Resume.js进行简单的node进程管理。
欢迎围观,转载请标明出处: