人工智能(AI)领域的专利挖掘及撰写建议

2019-07-15
 


曾尧 | 张岩龙 | 魏嘉熹2019年7月15日


1. 人工智能领域技术特点

人工智能(AI)在技术层面主要涉及大数据、自然语言处理、深度学习、语音识别、图像识别以及计算机视觉等技术,各技术均可能涉及到数学模型的生成和应用,并且大量创新也是集中在与模型相关的研究。AI领域专利申请中与模型有关的技术环节较多,且对于方案改进点的判断较为复杂,需要代理师具备一定的相关知识储备量。

总体而言,与模型有关的技术的实施可以分为模型生成和模型应用这两个环节。关于模型生成和模型应用二者的联系与区别,以神经网络模型为例,大致可以从下表中的几个角度来考虑[1]:




由此不难发现,模型生成和模型应用是两个相对独立的过程,二者的实施方也可能并不一致。例如厂商A实施模型生成,而厂商B实施模型应用。鉴于模型生成和模型应用存在的上述联系和区别,因此在专利挖掘和撰写时应先判断改进点属于哪个环节或者哪几个环节,对于不同环节的改进点,考虑到客体问题、创造性问题、抓侵权角度问题,权利要求的布局策略也是不同的。


2. 挖掘时需要考虑的因素

AI领域涉及到的数学模型众多,包括神经网络、支持向量机、决策树、贝叶斯等,其中,尤其又以神经网络的应用最多,在此主要以神经网络领域为例进行分析。

(1) 客体问题
单纯的神经网络模型的训练,易被审查员认定为是依据人为主观规定的规则对神经网络模型进行训练,且没有对计算机设备以及系统的内部性能(例如数据传输、内部资源管理等)带来改进,也没有给计算机设备的硬件构成带来任何技术上的改变。在这种情况下,就存在不属于专利保护客体的问题。因此,在专利挖掘时,应结合具体的实施场景,将神经网络模型作为该实施场景中的一个步骤、环节,模型输出结果作为解决该实施场景中的技术问题的一个中间量,从而构建出整个技术方案,而不应该单纯将视角停留在模型训练阶段。

(2) 创造性问题
挖掘过程中,经常会发现技术人员提出的方案是将一些通用的神经网络模型直接移植到某一新领域下,这种技术方案发明人会觉得很有创新,但是就专利申请的视角而言,创造性方面是比较薄弱的。对于某一应用场景,在现有技术中已经存在使用神经网络模型的应用的情况下,欲申请的技术方案若只是考虑更多维度的模型输入信息,且对模型本身不具有适应该场景的改进,创造性也是不足的。因此,在专利挖掘时,应深入应用场景具体分析该场景区别于其他场景的地方,并考虑针对该区别,如何调整神经网络模型,使得该模型更贴合具体的应用场景。

3.涉及神经网络类申请的权利要求撰写建议

(1) 优先布局模型应用的权项,再布局模型生成的权项。

这种考虑主要来源于如下几点因素:
a. 神经网络模型的生成包括模型的建立和模型的训练,这两部分一般是线下离线进行,且只需执行一次。而模型生成之后,可能会在线上被用户多次重复应用,因此模型应用再现的可能性比模型生成再现的可能性高[1]。
b. 模型生成一般是商家在后台完成,而模型应用则大多由用户端在前台进行。在抓侵权过程中,直接从商家后台取证是很难的,而从用户端取证则较为容易。并且,在已坐实用户端侵权的情况下,能够毫无疑义地证实商家在模型测试过程中,肯定也执行了模型应用的方法,由此可将商家也作为侵权主体。

c. 即便技术方案的改进点仅在模型生成阶段,由于在国内目前的审查制度下,单纯对通用神经网络模型本身的改进不属于专利保护客体,需再结合具体的应用场景。而一旦在模型训练过程中结合应用场景,必然涉及到在该场景下具有使用需求的实施方(训练的数据需实施方提供),该实施方通常与模型应用的实施方是相同的,因此,从抓侵权的角度出发,优先布局模型应用的权利要求不会导致遗漏侵权责任方的问题。

(2) 尽量减少模型细节的公开

如果模型本身是现有技术,改进点在于模型应用,则在说明书中对模型进行描述(如模型架构、如何训练等)即可,无需在权利要求中对模型进行详细描述。此方式相当于将模型视作“黑匣子”,撰写权利要求时只描述获得输入数据,将输入数据输入至模型以获得输出数据[1]。

(3) 采用静态限定的方式来限定模型生成

a. 如果神经网络本身的训练机制是现有的,只是改进了参数更新算法或者损失函数,则可以对改进的算法采用静态限定的方式进行撰写,例如“根据权利要求1所述的方法,其特征在于,所述神经网络模型的损失函数为XXXXXXX(损失函数公式)”。另外,为了避免执行主体的不一致,对于独权是模型应用过程,但需要将训练过程写入到从权的情况,可以采用“其中,所述神经网络模型是通过如下方式进行训练的”这种描述,本质上是一种对神经网络模型的静态限定,说明书可以解释其执行主体可以是离线的系统。

b. 针对改进点在模型生成过程、模型应用未做改进,但仍想要独权优先部署模型应用的情况,可以在独权中写模型应用的步骤,且通过静态限定的方式对模型生成过程的特征进行限定。例如:
“一种虚拟机器人互动的方法,其特征在于,包括
获取用户输入的与所述虚拟机器人进行交互的互动信息;
将所述互动信息输入所述虚拟机器人的控制模型,其中,所述控制模型是以视频直播平台的用户输入的互动信息以及主播针对该互动信息的行为反应信息作为模型训练样本训练得到的;
根据所述控制模型基于所述互动信息输出的行为控制信息,对所述虚拟机器人进行行为控制。”

(4) 对于公式的处理

发明人交底书中对神经网络的说明,例如损失函数、参数更新算法,一般是直接给出了公式,这种情况,尽可能抽象出原理性的技术特征,并布局该技术特征对应的权利要求。进一步地,若在该原理下,具体的公式有多种,而最优的公式申请人希望作为技术秘密保护,则可以将符合该原理的替代公式作为进一步的从权进行部署,而不公开最优公式。另外,可能某些方案的创新点在于采用了与现有技术不同的参数进行运算,对于这种情况,考虑到原理性的技术特征的权利要求可能已经能够体现方案的创新点,而公式表达的仅仅是一个具体的计算方式,且公式本身对权利要求的保护范围限定较局限,此种情况下,也可以将公式作为对原理性的技术特征的权要的解释说明,放到实施例中作为一个示例来描述。

(5) 提前预防可能存在的客体问题

根据目前专利局的审查尺度,单纯的模型生成方法存在不属于专利保护客体的嫌疑。所以,对于改进点仅在于训练过程的方案,应尽量在独立权利要求中体现该模型训练的应用场景,以避免被认为只是单纯的数学算法改进,或者,在从权部署能表明应用场景的权利要求,或者,至少也应该在说明书中记载该模型训练在具体的应用场景下的实施例。这样在收到客体问题的审查意见时,能通过并入从权或者说明书内容的方式进行答复。

例如,权1是一种模型训练方法,权2是模型的应用过程,该应用过程需写明具体场景需要采集的数据,模型输出结果的应用,从具体的应用中体现能够达到的技术效果,解决的技术问题,从而在收到针对权1的客体问题的审查意见时,可以将权2的内容并入到权1进行答复。

又如,方法独立权利要求记载了一种构建模型的方案,“一种构建系统模型的方法,所述系统包括多种类型的设备,每种类型的设备分别包括多个设备,其特征在于,所述方法包括:构建前馈神经网络……;对所述前馈神经网络进行训练,得到所述系统的系统模型。”

上述权利要求公开的方案即为一种模型训练的方法,权利要求内容上看该方案可以应用于各种场景,缺乏具体的应用场景,所以审查员在审查意见中指出“上述权利要求未明确限定该方法处理的具体技术问题,未与具体的技术领域相结合,解决的问题是通过人的思维活动而进行的方法算法问题,属于一种数学问题而不是技术问题,其实际采用的手段是前馈神经网络构建的系统模型,不是技术手段,其方案带来的效果也是算法改进带来的算法/数学效果,而非技术效果”。

可见,由于本权利要求没有记载模型训练针对的具体的应用场景,因此,审查员认为该权利要求不是授予专利权的客体。申请人在答复审查意见时,将说明书中记载的应用场景的相关内容补入该权利要求中,修改后的权利要求为:

一种构建系统模型的方法,应用于中央空调系统的建立或校验,所述中央空调系统包括:冷却塔、冷却泵、冷机以及冷冻泵四种类型的设备,其特征在于,所述方法包括:构建前馈神经网络,所述前馈神经网络包括输入层、多个隐藏层和输出层,所述输入层包括多个所述冷却塔的参数、多个所述冷却泵的参数、多个所述冷机的参数以及多个所述冷冻泵的参数,其中,一个神经元可以对应一个设备的参数,所述输出层的输出对应为所述中央空调系统的输出,所述输入层根据设备的类型划分为多个设备区,与所述输入层直接连接的隐藏层划分为多个隐藏区,所述多个隐藏区与所述多个设备区一一对应,每个设备区中的神经元仅与所对应的隐藏区中的神经元全连接;对所述前馈神经网络进行训练,得到所述中央空调系统的系统模型;根据所述系统模型建立或者校验所述中央空调系统。

其中,上述下划线部分为根据说明书记载补入权利要求中的内容,从而将原先的模型训练的方案与实际的模型应用相结合,使得该权利要求符合专利法第二条第二款的规定,上述修改得到了审查员的认可。

(6) 撰写过程中需要有应对海外专利布局的意识

考虑到AI领域的专利海外布局的可能性较大,因此,即便在撰写阶段尚不确定是否要到海外布局,但也可以通过一些撰写方式保证后续如果有到海外申请的需求,权利要求可以适应各个国家的专利审查要求而进行调整。例如:欧洲专利申请允许保护程序产品,而程序产品涵盖的范围相较计算机存储介质更广,因此,可以在发明内容以及说明书具体实施方式中增加程序产品相关的描述。这样,如果需要到欧洲申请,可以将存储介质权要替换为程序产品的权要。

此外,美欧日对AI领域专利申请在客体问题,创造性问题以及公开不充分与说明书支持问题三方面相关的规定也略有不同,具体可以参考文献[2]中的内容,这里不再赘述。

4. 对于涉及神经网络类申请的说明书撰写建议

对于AI领域的说明书撰写,由于要求神经网络模型需要应用到具体场景解决技术问题,因此,说明书具体实施方式中,可以首先介绍实施场景,引出本申请的发明目的,再部署模型生成的相关实施例,之后再部署模型应用的相关实施例,更符合逻辑顺序,方便审阅者理解。

涉及到模型结合使用了其他现有算法的技术方案,说明书无需对现有算法的原理进行详细交代,但需清楚发明人为何选择该算法,该算法在模型中是如何生效的。而说明书中对整个技术方案是如何采用符合自然规律的技术手段来解决技术问题的阐述是必要的,这需要从模型运行的原理上进行推导,这也是最考验代理师技术理解能力的地方,通常需要发明人配合代理师完成这项内容的撰写。

另外,对于神经网络类申请的说明书附图,在针对模型网络结构本身有改进的方案,可以对模型网络结构进行分层绘制,其中,每一层具有特定的数据处理逻辑,以及相应的层参数,并且,层与层之间根据模型内部的数据流向具有级联关系,即上一层的输出作为下一层的输入。如此绘制,可以更直观地体现出方案对模型的改进点,如下图所示,审阅者在文字说明的辅助下,能够很快理解模型的具体构成,存在的改进点:




参考文献:
[1] AI这么火,那么专利申请文件怎么撰写?-------- 李文渊 
[2] 中美欧日在人工智能及机器学习领域的专利审查规定与实例分析 -------- 佑斌
010-62662766
010-62662006
mail@innotrack.cn