Quartz Job Scheduling Framework[翻译]第四章. 部署 Job (第二部分)

3. 管理 Scheduler

除了启动 Scheduler, 在应用的生命周期中你也许还要执行 Scheduler 的别的一些操作。这些 Scheduler 操作包括查询、设置 Scheduler 为 standby 模式、继续、停止。很多情况下,当一个 Scheduler 启动后,除让它运行之外你不需要对它做任何事情的。在某些情形下,你也可能会要临时的终止 Scheduler 而转入到 standby 模式。

·启动 Scheduler

启动一个 Scheduler 也不总是一目了然的。当你有了 Scheduler 的实例,并得到正确的初始化,你的 Job 和 Triiger 也已注册上去了,你只需要简单的调用 start() 方法:

一旦 start() 方法被调用,Scheduler 就开始搜寻需要执行的 Job。在你刚得到一个 Scheduler 新的实例时,或者 Scheduler 被设置为 standby 模式后,你才可以调用 start() 方法。只要调用了 shutdown() 方法之后,你就不能再调用 Scheduler 实例的 start() 方法了。

别在 shutdown() 之后调用 start()
Scheduler 实例被关闭之后你就不能调用它的 start() 方法了。这是因为 shutdown() 方法销毁了为 Scheduler 创建的所有的资源(线程,数据库连接等)。假如你在 shutdown() 之后调用 start()你将收到 SchedulerException 的异常。

·Standby 模式

设置 Scheduler 为 standby 模式会导致 Scheduler 暂时停止查找 Job 去执行。例如,假定你的 Scheduler 是从数据库中获取到的 Job 信息,这时候你需要重启数据库。在数据库恢复之后你也需要重新启动 Scheduler,或者仅仅是设置为 standby 模式就行了。你能通过调用 standby() 方法让 Scheduler 进入到 standby 模式:

在 standby 模式,Scheduler 不再试图去执行 Job,因为那些搜寻要执行的 Job 的线程被暂停了下来。

·停止 Scheduler

你能使用两个版本的 shutdonw() 方来停止 Scheduler:

上面那两个方法唯一不同之处是其中一个方法可接受一个 boolean 型参数,表示是否让当前正在进行的 Job 正常执行完成才停止 Scheduler。无参的 shutdown() 方法相当于调用 shutdown(false).

4. 管理 Job

前面章节我们粗略的看了 Quartz Job,现在来详细正式的讨论 Quartz Job 和怎样使用它们。

·什么是 Quartz Job?

很简单,一个 Quart Job 就是一个为你执行一个任务的 Java 类。这个任务是你能用 Java 编码的任何东西。下面就是一些任务的例子:

    ·使用 JavaMail (或别的 Mail 框架、如 Commons Net) 发送 e-mail

    ·创建一个远程接口并调用 EJB 上的方法

    ·获得 Hibernate 会话,查询、更新关系数据库中的数据

    ·使用 OSWorkflow 并在 Job 中调用一个工作流

上面的例子仅仅是一部份;你一定能列出不少你自己的任务。任何 Java 能做的事情都可以成为一个 Job.

·org.quartz.Job 接口

把 Quartz 作用到 Java 类上唯一要做的就是让它实现 org.quartz.Job 接口。你的 Job 类可以实现任何其他想要的接口或继承任何需要的基类,但是它自己或是它的超类必须实现这个 Job 接口。这个 Job 接口只定义了单个方法:

当 Scheduler 决定了是时候运行 Job 时,方法 execute() 就会被调用,并传递一个 JobExecutionContext 对象给这个 Job。Quartz 加给方法 execute() 要承担的唯一合约责任就是如果在 Job 中出现严重问题时,必须抛出一个 org.quartz.JobExecutionException 异常。

·JobExecutionContext

当 Scheduler 调用一个 Job,一个 JobexecutionContext 传递给 execute() 方法。JobExecutionContext 对象让 Job 能访问 Quartz 运行时候环境和 Job 本身的明细数据。这就类似于在 Java Web 应用中的 servlet 访问 ServletContext 那样。通过 JobExecutionContext,Job 可访问到所处环境的所有信息,包括注册到 Scheduler 上与该 Job 相关联的 JobDetail 和 Triiger。代码 4.4 展示了一个叫做 PrintInfoJob 的 Job 打印出相关的一些信息。

从代码 4.4 中可以看到,Quartz Job 的一个非常基础的代码。PrintInfoJob 获得存储在   JobExecutionContext 中的 JobDetail 对象,进而打印出 Job 相关的基本明细。还JobDetail 类还会被给予更多的一些讨论。

代码 4.4. PrintInfoJob 显示了如何访问 JobExecutionContext

·JobDetail

你第一次看到 org.quartz.JobDetail 类是在前面的第三章。对于部署在 Scheduler 上的每一个 Job 只创建了一个 JobDetail 实例。JobDetail 是作为 Job 实例进行定义的。注意到在代码 4.5 中不是把 Job 对象注册到 Scheduler;实际注册的是一个 JobDetail 实例。

代码 4.5. 注册到 Scheduler 上的是一个 JobDetail,而不是 Job

 

在代码 4.5 中你可以看到,JobDetail 被加到 Scheduler 中了,而不是 job。Job 类是作为 JobDetail 的一部份,但是它直到 Scheduler 准备要执行它的时候才会被实例化的。

直到执行时才会创建 Job 实例

Job 的实例要到该执行它们的时候才会实例化出来。每次 Job 被执行,一个新的 Job 实例会被创建。其中暗含的意思就是你的 Job 不必担心线程安全性,因为同一时刻仅有一个线程去执行给定 Job 类的实例,甚至是并发执行同一 Job 也是如此。

·使用 JobDataMap 对象设定 Job 状态

你能使用 org.quartz.JobDataMap 来定义 Job 的状态。JobDataMap 通过它的超类 org.quartz.util.DirtyFlagMap 实现了 java.util.Map 接口,你可以向 JobDataMap 中存入键/值对,那些数据对可在你的 Job 类中传递和进行访问。这是一个向你的 Job 传送配置的信息便捷方法。代码 4.6 描述的就是,我们特意创建了一个叫做 PrintJobDataMapJob 的 Job,使用了这种方式。

代码 4.6. 使用 JobDataMap 向你的 Job 传递配置信息

在代码 4.6 中,我们想要传递给 PrintJobDataMapJob 的信息存储到了 JobDetailJobDataMap 中。因为 JobDataMap 实现了 java.util.Map 接口,所以我们可以以键/值对的形式在其中存储状态。JobDataMap 包含了许多精细的方法使处理起对象来方便简易。一般使用 map 的话,我们不得不要显式把 Object 类型转换成已知类型。JobDataMap 包含的方法能帮你完成这些工作。

当 Scheduler 最后调用了 Job,Job 可以通过 JobDetail 来访问到 JobDataMap 中的键/值对。代码 4.7 就是这个 PrintJobDataMapJob.

代码 4.7. Job 能通过 JobExecutionContext 对象访问 JobDataMap

当你获得了 JobDataMap,你可以当它是任何 map 实例一样调用它的方法。一般的,你会自己选择一个预定义的键值来访问 JobDataMap 中的数据。你也可以像代码 4.7 那样遍历其中的所有数据。

PrintJobDataMapJob 那样的 Job,JobDataMap 中的属性成为了一个在部署 Job 的客户端与 Job 自身之间的一个非正式的契约。Job 的创建者应该非常仔细的文档化规定哪些属性是必须的,哪些又是可选的。这样有助于确保 Job 能被团队中的其他成员重用。

自 Quartz 1.5 始,JobDataMap 对 Trigger 也是可用的

在 Quartz 1.5 中,JobDataMap 在 Trigger 级也是可用的。它的用途类似于 Job 级的 JobDataMap,此外它还能支持应用在同一个 JobDetail 上的多个 Trigger 上。伴随着加入到 Quartz 1.5 中的这一增强特性,可以使用 JobExecutionContext 的一个新的更方便的方法获取到 Job 和 Trigger 级的并集的 map 中的值。这个方法就是 getMergedJobDataMap(),它能够在 Job 中使用。从 Quartz 1.5 之后,使用这个方法被认为是获取 JobDataMap 最佳实践。

·有状态的之于无状态的 Job

你从前一节中学到,信息可插入到 JobDataMap 中然后被 Job 访问到。然而,对于每一次的 Job 执行,都会为特定的 Job 取用存储在某处(例如,数据库中)的值创建一个新的 JobDataMap 实例。因此,无法为两次 Job 调用之间持有那些信息,除非你使用有状态的 Job.

同样的方式,J2EE 中有状态的 Session Bean(SFSB) 能在两个调用之间保持状态,Quartz 的 StatefulJob 也能在两次 Job 执行间保持它的状态。然而,正如 SFSB 那样,Quartz 的有状态的 Job 与无状态的 Job 比起来也有一些不利的方面。

·使用有状态的 Job

当你需要在两次 Job 执行间维护状态的话,Quartz 框架为此提供了 org.quartz.StatefulJob 接口。StatefulJob 接口仅仅是扩展了 Job 接口,未加入新的方法。你只需要通过使用与 Job 接口相同的 execute() 方法简单的实现 StatefulJob 接口即可。假如你有已存在的 Job 类,你所有要做的只是改变 Job 的接口为 org.quartz.StatefulJob

Job 和 StatefulJob 在框架中使用中存在两个关键差异。首先,JobDataMap 在每次执行之后重新持久化到 JobStore 中。这样就确保你对 Job 数据的改变直到下次执行仍然保持着。

改变有状态 Job 的 JobDataMap

你可以在有状态 Job 中简单的通过 map 的 put() 方法来修改 JobDataMap.已存在的任何数据会被新的数据覆盖掉。你也能对无状态的 Job 这么做,但是因为对于无状态 Job 来说,JobDataMap 不会持久化,所以数据不会保存下来。对于 Trigger 和 JobExecutionContext 上的 JobDataMap 的数据修改也是没能保存下来的。

另一个无状态和有状态 Job 重大区别就是:两个或多个有状态的 JobDetail 实例不能并发执行。说的是你创建并注册了一个有状态 JobDetail 到 Scheduler 上。你还建立了两个 Trigger 来触发这个 Job:一个每五分钟触发,另一个也是每五分钏触发。假如这两个 Trigger 试图在同一时刻触发 Job,框架是不允许这种事情发生的。第二个 Trigger 一直会被阻塞直到第一个结束。

这就产生了处理 JobDataMap 存储的需求了。因为 JobDataMap 的存储是伴随着 JobDetail 的,而 JobDetail 定义了 Job 实例,所以线程安全性问题必须纳入到我们考虑的范畴。同一时刻只能由一个线程去运行并更新 JobDataMap 存储。然而,由于在第一个 Trigger 有机会更新存储之前第二个就会试图执行 Job,所以数据有可能会出错。甚至可能的话还会第二个 Trigger 先于第一个执行完成(依赖于你的 Job 所做的事情),这时就可能会出现奇怪的结果。

因为这些区别,在你使用 StatefulJob 时可要谨慎了。当你需要避免并发执行一个 Job 时,那么有状态 Job 就是你最简单的筹码了。在 J2EE 的世界里,有状态一词已经引起了一些负面影响,但对于 Quartz 却非如此。

本文链接 https://yanbin.blog/quartz-job-scheduling-framework-4-2-2/, 来自 隔叶黄莺 Yanbin Blog

[版权声明] Creative Commons License 本文采用 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 进行许可。

Subscribe
Notify of
guest

17 Comments
Inline Feedbacks
View all comments
zxming12345
16 years ago

"这个任各是你能用 Java 编码的任何东西" 又看到了一个小错误(如果不是错误,请谅解)

zxming12345
16 years ago

"任务 Java 能做的事情都可以成为一个 Job" 应该是任何

隔叶黄莺
16 years ago

十分谢谢,我照你的意见改过来了,有你以这么欣赏的态度阅读我翻译的东西,真是无比感激。

zxming12345
16 years ago

问个问题:下面这段文字,说我的job不用担心线程安全问题。
// start
直到执行时才会创建 Job 实例

Job 的实例要到该执行它们的时候才会实例化出来。每次 Job 被执行,一个新的 job 实例会被创建。其中暗含的意思就是你的 Job 不必担心线程安全性,因为同一时刻仅有一个线程去执行给定 Job 类的实例,甚至是并发执行同一 Job 也是如此。
// end

但是,jobDetail 中设置的参数,不用担心线程安全的问题吗? 比如我动态的加入一些job 。 jobDetail中,加入的参数,是当前用户 session 中的数据。这个时候,jobDetail 引用的参数,其实是session中数据,当session中的参数改变的时候,jobDetail中的数据就会变化了。或则执行任务的时候,修改了参数的值,session 中的数据也会改变。

quartz 内部对参数有克隆处理吗?

隔叶黄莺
16 years ago

像你说的传入的 session 数据的引用,是没办法保证了。

文
16 years ago

quartz在1.4.3版本发现用RAMJobStore方式有问题,每次运行到最后只剩下一个任务在跑,发现和RAMJobStore数据结构有问题,用的是TreeSet存储timeTrgger,经常出现timeTrgger.remove(tw)的时候返回false,比较器TriggerComparator比较方式问题,升级新版本1.5.0,进行了改进,问题解决,折腾四了

文
16 years ago

偶测试RAMJobStore类中acquireNextTrigger方法,timeTriggers.remove(tw);会返回false,造成具体原因没仔细考究了,期待楼主能有见解!

kida
kida
15 years ago

我的web application加了quartz后,

现在shutdown tomcat都会发现无法完全关掉

在solaris环境下指令ps都还找的到这个程序

必须强制kill掉才行

试过不启动quartz跟启动quartz两种情况

发现有启动才会有这种情形

猜测是否tomcat shutdown后

quartz的线程还没结束

请问你有遇过这情形吗?

隔叶黄莺
15 years ago

@kida

可以加一个 ShutdownHookPlugin,参考:http://www.blogjava.net/Unmi/archive/2008/07/22/216704.html,当它捕获到 VM 的退出时可干净的关掉 Scheduler。

或者你在 web.xml 配置一个 ContextListener 也彻底关闭 Scheduler。

Quartz 是以非守护线程来运行的。

kida
kida
15 years ago

@隔叶黄莺

感谢你的帮忙

我猜应该是scheduler没有shutdown的关系

kida
kida
15 years ago

@隔叶黄莺

原本项目中就有用ServletContextListener

所以我便在destroyed时shutdown scheduler

顺利的解决这个问题了

感谢你的帮忙

forrest
forrest
14 years ago

你好!请教你一个问题:我在用quartz执行任务时,在业务方法中,需要休眠一段时间,然后再接着处理业务。我用了Thread.sleep(500)。但实际运行中发现,sleep有时起作用,有时无效(不休眠,也不抛出异常)。请教如何解决?

隔叶黄莺
14 years ago

@forrest

你是怎么感觉到它是没有生效,500时间比较短,搞个时间长一点,然后在 sleep() 两端输出个时间看看。

forrest
forrest
14 years ago

我是看日志,程序设置休眠500毫秒,日志显示,有时休眠1秒,有时不休眠,接着执行下面的业务。

隔叶黄莺
14 years ago

是不是同一个线程打印出来的

forrest
forrest
14 years ago

是同一个线程。

隔叶黄莺
14 years ago

@forrest

没碰过这种情况。