外观
算法块
约 461 字大约 2 分钟
2025-09-14
基于自定义语法实现的算法块
Algorithm 1:
算法名称
Input:
输入内容
Output:
输出内容
算法正文
::: algorithm
@caption 算法名称
@input 输入内容
@output 输出内容
---
算法正文
:::
Algorithm 1:
根据 ErtNER 数据集构建基于缩放点积注意力机制的企业风险术语识别模型进行训练,从而输出数据集的评价估指标精确度、召回率和 F1 值。
Input:
对原始文本进行预处理工作,得到非结构化的风险文本,对风险文本进行标注并转换为结构化的 ErtNER 数据集;
Output:
测试集 ErtNER.test 的评估指标精确度、召回率和 F1 值;
Step1: 把标准化的 ErtNER 数据集通过向量表示层的 RoBERTa-wwm 预训练模型进行字嵌入,获得特征向量矩阵VRoBERTa ;
Step2: 把向量表示层输出的特征向量矩阵VRoBERTa输入到特征抽取层的 BILSTM 网络中捕捉时序特征和长距离依赖关系,得到特征向量矩阵VBILSTM;
Step3: 在辅助分类层,把特征抽取层的特征向量矩阵VBILSTM作为主分类器,向量表示层输出的特征向量矩阵VRoBERTa作为辅助分类器,充分利用多层级的特征信息;
Step4: 在注意力层,采用缩放点积注意力机制对特征向量矩阵VBILSTM和 VRoBERTa进行特征融合,得到注意力矩阵VAttention ,计算公式如下:
VAttention(VBILSTM,VRoBERTa)=softmax(dKVBILSTMVRoBERTaT)V
Step5: 在输出层,使用 CRF 模型对标签进行解码,完成模型的训练任务,同时对测试集 ErtNER.test 进行预测,输出测试集的评估指标精确度、召回率和 F1 值。
::: algorithm
@label 算法 4.1
@caption 根据 ErtNER 数据集构建基于缩放点积注意力机制的企业风险术语识别模型进行训练,从而输出数据集的评价估指标精确度、召回率和 F1 值。
@input
对原始文本进行预处理工作,得到非结构化的风险文本,对风险文本进行标注并转换为结构化的 ErtNER 数据集;
@output
测试集 ErtNER.test 的评估指标精确度、召回率和 F1 值;
---
_Step1:_ 把标准化的 ErtNER 数据集通过向量表示层的 RoBERTa-wwm 预训练模型进行字嵌入,获得特征向量矩阵$V_{RoBERTa}$ ;
_Step2:_ 把向量表示层输出的特征向量矩阵$V_{RoBERTa}$输入到特征抽取层的 BILSTM 网络中捕捉时序特征和长距离依赖关系,得到特征向量矩阵$V_{BILSTM}$;
_Step3:_ 在辅助分类层,把特征抽取层的特征向量矩阵$V_{BILSTM}$作为主分类器,向量表示层输出的特征向量矩阵$V_{RoBERTa}$作为辅助分类器,充分利用多层级的特征信息;
_Step4:_ 在注意力层,采用缩放点积注意力机制对特征向量矩阵$V_{BILSTM}$和 $V_{RoBERTa}$进行特征融合,得到注意力矩阵$V_{Attention}$ ,计算公式如下:
$$
V_{Attention}(V_{BILSTM},V_{RoBERTa}) = softmax(\frac{V_{BILSTM}{V_{RoBERTa}}^T}{\sqrt{d_K}})V
$$
_Step5:_ 在输出层,使用 CRF 模型对标签进行解码,完成模型的训练任务,同时对测试集 ErtNER.test 进行预测,输出测试集的评估指标精确度、召回率和 F1 值。
:::