露尼西亚LOL lunix( 四 )


tail -F 等同于–follow=name --retry , 根据文件名进行追踪 , 并保持重试 , 即该文件被删除或改名后 , 如果再次创建相同的文件名 , 会继续追踪
tailf 等同于tail -f -n 10 , 与tail -f不同的是 , 如果文件不增长 , 它不会去访问磁盘文件 , 所以tailf特别适合那些便携机上跟踪日志文件 , 因为它减少了磁盘访问 , 可以省电 。
监测程序是否在正常运行中:ps
ps命令也可以和nohup命令配合使用 , 用于显示当前进程 (process) 的状态 。可以监视后台程序是否在正常运行中或者已经挂掉 。
ps -ef|grep yourcommand# -ef 参数显示所有命令 , 连带启动时的命令行参数
qsub命令用来从登陆节点上向计算节点进行任务投递 。前提是在服务器上有集群管理工具分配计算节点等 。SGE(SGE, Sun Grid Engine)集群管理工具可以用来提交批处理作业 , SGE支持单或多节点作业 , 它将用户投递的任务进行排队 , 然后将任务交给能够运行的结算节点执行 , 工作流程可以分为四步:接受用户投放的任务;在任务运行以前 , 将任务放到一个存储区域;发送任务到一个执行设备 , 并监控任务的运行;运行结束写回结果并记录运行日志 。
qsub [ options ] [ command | -- [ command_args ]]
1. -@ optionfile (contains all valid options)就是把qsub命令的可选项组合成一定功能的语句 , 保存在一个文件中 。qsub -a optionfilename jobfilename
2. -a date_time设置作业什么时候可以执行 。格式:CC YY MMDDHHMM.SS 如 201109272213.21qsub -a 201109272213.21 ../simplejob
3. -A account_stringIdentifies the account to which the resource consumption of the job should be charged设置一个作业的账户名,便于统计该账户使用的资源等信息qsub -A testaccountname jobname
4. -ac 添加名/值对到作业上下文-dc 删除 。。-sc 设置(修改) 。。Contexts provide a way to dynamically attach and remove meta-information to and from a job. The context variables are notpassed to the job's execution context in its environmentThe outcome of the evaluation of all -ac, -dc, and -sc optionsor corresponding values in qmon is passed to defined JSVinstances as parameter with the name -ac.
5. -ar ar_id 分配已提交作业 , 作为它的一部分 , 给已存在预约 。ar=advance reservationqsub -ar 60 jobname#ai_di = unsigned integer
6.-b y[es]|n[o]Gives the user the possibility to indicate explicitly whethercommand should be treated as binary or script.
7. -binding 等待理解
8.-c occasion_specifier(际符)定义或者重定义作业是否要被检查 , if是 , 在什么环境下 。nno checkpoint is performed.scheckpoint when batch server is shut down.mcheckpoint at minimum CPU interval.xcheckpoint when job gets suspended.intervalcheckpoint in the specified time interval.qsub -c n jobname
9. -C prefix_string 前缀字符串定义一个在作业命令中的指令qsub -C "#$" ../simplejob
10.-ckpt ckpt_name 选择检查点环境来检查一个作业 , 同时声明这个作业是检查点作业 。qsub -ckpt allanckpt ../simplejob
11.-clear 重置作业的所有元素为初始默认状态qsub -clear ../simplejob
12.-cwd =current working directory从当前的目录开始执行作业 。如果有相应的配置文件的话 , 这个命令将启动网格引擎的路径别名设备 。
13.-dl date_time 设置作业在deadline之前执行完 , 格式为CC YYU MMDDHHMM.SSqsub -dl 201101131159.01 ../simplejob
14.-e [[hostname]:]path,...定义或重新定义作业的标准错误流使用的路径 e=stderror
15.-h | -h {u|s|o|n|U|O|S}... h=hold 暂停作业执行'u' .........user hold.`s'denotes a system hold.`o'denotes a operator hold.`n'denotes no hold (requires manager privileges).`U'removes a user hold.`S'removes a system hold.`O'removes a operator hold.qsub -h ../simplejob(qsub只能使用-h)
16.-l resource=value,... l=launch 启动满足资源需求的作业Launch the job in a Grid Engine queue meeting the given resourcerequest list.In case of qalter the previous definition isreplaced by the specified one.qsub -l s_core=5 ../simplejob
17.-q wc_queue_list 定义或重定义可能用来执行作业的队列 , 包括群聚队列、队列域、队列实例 。qsub -q all.q ../simplejob
18.-hard表示该作业在安排执行之前 , 作业的资源需求必须满足 。qsub -hard../simplejob
19.-soft 表示该作业在安排执行之前 , 作业的资料需求可以有、但不必须有 。qsub -soft ../simplejob

秒懂生活扩展阅读