Discovery of marine heatwave event patterns based on restricted motif association rules
-
摘要:
海表温度作为近岸海洋热浪事件的重要孕灾环境要素,揭示其变化规律有助于预测未来热浪事件的发生。本文将用于表达热浪事件发生前和发生时海表温度变化规律的关联规则定义为事件模式,提出了基于限定motif关联规则挖掘的模式发现方法。方法通过STAMP算法挖掘出motif,运用MDL评分策略分割motif形成候选关联规则,结合热浪事件发生的约束条件,实现对海洋热浪事件模式的提取。本文利用中国近海3个站点的海表温度数据进行海洋热浪事件模式发现实验,研究结果表明,中国近海的海洋热浪呈季节特征,主要发生于夏季,且持续时间达20天以上,海洋热浪事件模式呈现有规则的升温和下降趋势,升温速率和降温速率呈对称特性,且在热浪发生前,海表温度有一个短暂的升温间歇期。
Abstract:Sea surface temperature is an important disaster-promoting environmental factor for nearshore marine heatwave events, and revealing its variation pattern will help predict the occurrence of future heatwave events. In this paper, the association rules used to express the changes of sea surface temperature before and during heat wave events are defined as event patterns, and a pattern discovery method based on restricted motif association rule mining was proposed. The STAMP algorithm was used to mine the motifs, and the MDL scoring strategy was used to segment the motifs to form candidate association rules. Combined with the constraints of the occurrence of heat wave events, the pattern of marine heat wave events was extracted. In this paper, the sea surface temperature data from three stations in China's coastal waters are used to conduct a marine heat wave event pattern discovery experiment. The results show that the marine heat wave in China's coastal waters is seasonal, mainly occurs in summer, and lasts for more than 20 days. The marine heat wave event pattern has a regular heating and falling trend, the heating rate and cooling rate are symmetrical, and before the heat wave occurs, the sea surface temperature has a short heating interval.
-
Keywords:
- time series /
- association rule mining /
- marine heatwave events
-
随着全球气候变暖,海洋热浪(marine heatwave,MHW)的发生及其历史演变和影响引起人们的广泛关注。中国沿岸和近岸海域热浪事件频发,严重影响了海洋生态系统的功能以及社会经济发展和人民生命财产安全,因此,现阶段亟须开展海洋热浪事件的预测研究。海表温度(sea surface temperature,SST)作为海洋中的关键热力要素,不仅通过海陆气相互作用影响周边的气候与环境演变,更是近岸热浪事件的重要孕灾环境要素[1]。近年来,中国近海的升温速度远快于全球平均水平,更易遭受频繁、持久和较高强度的极端高温[2-3]。相关研究表明,1982-2018年,中国近海MHW的年平均总天数、持续时间、频率和平均强度逐年增加,其变化主要源于强劲的海洋表面变暖[4]。因此,挖掘海表温度数据中潜在的变化规律,进而发现海洋热浪事件模式,可以为准确预测热浪事件提供重要参考信息,对沿海地区提前采取相关措施应对海洋热浪事件具有重要的科学意义。Liu等[5]根据Hobday等人对MHW的定义,调查了1982-2018年中国南海的MHW,并通过统计分析的方法讨论其多样性,结果表明,南海MHW的发生具有明显的季节变化。Li等[6]利用高分辨率(0.25°×0.25°)的卫星全球日海温(SST)数据分析了1998-2013年中国海域的MHW,结果表明,与1982-1997年的MHW 相比,1998-2013年的MHW的频率和强度均有所提高。Yao等[4]利用逐日海面温度数据对中国边缘海和邻近海域MHW的时空变化进行系统分析,结果表明,1982-2018年,MHW的年平均总天数、持续时间、频率和平均强度均显著增加,且频率、持续时间和平均强度均高于全球平均值的两倍。齐庆华等[7]基于1982-2017年日再分析数据,分析了中国近海海表温度变化的极端特性、历史演变、空间格局及可能影响,并探讨了与全球变化和区域气候变率的关联性。由于再分析数据对我国沿岸和近岸海域描述的精细化程度和准确性较弱,目前对于海洋热浪事件主要从统计学意义上研究事件的演变特征和规律,如发生的频率、强度和空间分布等,缺乏对近海海洋热浪事件的预测研究。
海表温度监测数据是典型的长时序数据,现阶段,时间序列关联规则挖掘是发现长时序数据模式的重要方法。该方法通过发现数据行为属性与序列属性之间的关联规则,识别有价值的数据结构,如数据项集、子序列、序列集等,并据此抽象出序列数据的整体概要信息[8-12],从而在含有噪声和信息不完全的大量数据中提取出潜在变化规律。
传统时间序列领域的规则挖掘算法大都基于Apriori算法。Agrawal和Srikant最先提出了AprioriAll和AprioriSome算法,之后出现的算法,如GSP算法[13]与SPADE算法[14],也是以此为理论基础改进的。这类基于Apriori性质的算法,在面对长模式挖掘或定义支持度较低的情况时,候选序列数量会激增,将直接导致计算复杂度变高,运算时间显著增加,识别速度降低。海洋热浪事件模式发现是典型的长模式挖掘问题,若直接运用基于Apriori性质的算法,会导致很多有价值的长模式很难被挖掘出来。
此外,在运用Apriori算法之前都需要对时间序列进行离散化处理,将原始序列编码成符号序列[15-18],符号化主要适用于时序数据中蕴含的变化趋势较为显著的情况,但是SST时序数据变化趋势较为平稳,子序列的差异较小,采用符号化的方式可能导致相似子序列的表示形式完全不同,易将两种相同模式误判为两种不同模式;同时,符号化的表示方法也可能造成原始时间序列信息的丢失,严重影响挖掘结果的可靠性。最近的研究[19-21]显示,时间序列中频繁出现的子序列motif[22]包含有关该序列的关键信息,与传统时间序列关联规则挖掘中的频繁项相对应,motif是原始序列信息的直接表达,避免了离散化过程中的信息丢失,保证了规则的真实性与可靠性。同时,针对于特定事件的模式发现,需要综合考虑事件的约束条件。例如,海洋热浪事件为持续至少5天并达到远高于正常范围临界温度的事件,且中国近海海洋热浪事件的多发季为夏季。结合事件约束条件可以帮助准确地发现相关事件模式,如果仅以时序数据为核心进行模式发现,而忽略事件的约束条件,容易导致挖掘的模式无效。
针对以上问题,本文提出了基于限定motif的关联规则挖掘方法,用以发现海洋热浪事件发生前后SST数据的变化规律,即海洋热浪事件模式。方法在挖掘motif时采用基于欧几里德距离的相似性搜索算法,筛选的候选序列明显减少,只需要O(nlogn)的时间复杂度,在海洋热浪模式发现的应用上,相较于传统方法,识别速度明显提升。
1 材料与方法
1.1 数据来源及数据预处理
本文数据来自中国台站观测数据集(http://mds.nmdis.org.cn/),选择3个具有代表性的站点LHT、DCN和ZLG,分别位于渤海、东海和南海。为保证模型的准确性,将原始数据集进行处理,首先将其缺失值或无效值用−999.9表示,其次采用均值替代的方法,用缺失值前后5个有效值的均值替代该缺失值。实验中使用的数据以当日每小时海温的平均值代替当日的海表温度,将采样频率步长扩大为1天。
1.2 基本定义
为了更清晰地描述方法,本节给出相关概念与定义。
定义1 时间序列(time series):时间序列T是一条含有n个按时间顺序排列数据点的序列,即T=t1,t2,···,ti,···,tn。其中,ti表示第i个时间点记录的观测数据,时间序列的长度为n。
定义2 子序列(subsequence):对于长度为n的时间序列T,若子序列长度为m,则T有n−m+1个子序列,将T中第i个子序列定义为
$ {T}_{i}^{m} $ ={ti,ti+1,···,ti+m−1},即从位置i开始按时间顺序依次取得m个数据点,其中m<n,且1≤i≤n−m+1。定义3 欧式距离(euclidean distance):给定两个长度为m的时间序列(或时间序列子序列)TSP和TSQ,它们之间的欧式距离为两个序列中对应数据点之间的差值平方和的平方根,如公式(1)所示。
$$ \mathrm{D}\left({TS}_{P},{TS}_{Q}\right)=\sqrt{{\sum} _{i-1}^{m}{TS}_{Pi}-{TS}_{Qi}} $$ (1) 定义4 距离轮廓(distance Profile):给定一个时间序列T,选择子序列Si(参考子序列),计算Si与其余子序列Sj的欧氏距离D(Si,Sj),得到的距离矢量Di=[D(Si,S1),D(Si,S2),···,D(Si,Sj)],称为该参考子序列Si的距离轮廓,如图1a所示。
定义5 距离矩阵(distance Matrix):距离矩阵是一个方阵(二维数组),矩阵的每一行为每个参考子序列计算出来的矩阵轮廓,如图1b所示。
定义6 矩阵轮廓(matrix Profile):存储时间序列中每个参考子序列与滑动窗口序列计算所得的欧氏距离的最小值。即取距离矩阵中每一行的最小值所组成的向量M,如图1c所示。
定义7 motif:motif是一段长时间序列中一对彼此最相似的时间序列子序列。
定义8 分割参数(segmentation parameter):分割参数是在(0,1)范围内的一个比率,它将一个motif划分为前一部分和后一部分,前一部分称为规则的前件,后一部分称为规则的后件。
定义9 关联规则(association rules):分割参数将一个motif划分为前件S和后件C,然后组成候选规则S→C,根据最小描述长度准则(minimum description length, MDL)的评分策略去评价该规则的好坏,最后选择评分最高的规则作为最后挖掘出的关联规则。
1.3 原理与方法
1.3.1 基于限定motif关联规则挖掘的模式发现方法
本文提出了基于限定motif关联规则挖掘的海洋热浪事件模式发现方法,方法主要包括两个部分:限定motif的挖掘和热浪事件模式发现。首先,运用HP滤波[23]算法对夏季SST时间序列做表征处理,获得平滑曲线表示;其次,使用STAMP(scalable time series anytime matrix profile)算法[24]发现序列中的motif并进行分割,形成候选关联规则;最后,结合MDL评分策略,对候选关联规则进行评分和排序,得分最高的一组作为热浪事件关联规则。关联规则的前件和后件分别描述了海洋热浪事件发生前和发生时SST数据的变化规律。基于关联规则和已知的前件可以实现对后件的预测,即实现对未来热浪事件发生的判定,方法的具体流程如图2所示。
1.3.2 Motif挖掘
STAMP是针对时间序列中motif挖掘的通用算法,该算法基于快速相似搜索[25],能够在短时间内发现长时序中的近似重复子序列。Motif挖掘主要包括两个步骤:计算子序列间的相似性和motif提取。在一个长度为n的时间序列中,假设子序列的长度为m,第i个子序列可表示为
$ {T}_{i} $ ={ti,ti+1,···,ti+m−1},其中1≤i≤n−m+1,对于每一个$ {T}_{i} $ ,在计算它与其余子序列之间的欧式距离后,可以得到距离轮廓Di=[$ {d}_{i}^{1} $ ,$ {d}_{i}^{2} $ ,···,$ {d}_{i}^{n-m+1} $ ],$ {d}_{i}^{j} $ 是$ {T}_{i} $ 和$ {T}_{j} $ 之间的欧氏距离。矩阵轮廓M可以表示为M=[min(D1),min(D2),···,min(Dn−m+1)],min(Di)是Di向量中的最小值。矩阵轮廓索引I存储最近邻或最近匹配的位置,其中I=[I1, I2,···,In−m+1,]。如果$ {d}_{i}^{j} $ =min(Di),则Ii=j,通过访问矩阵轮廓索引的第i个元素,可为每个$ {T}_{i}$ 快速检索最相似的子序列。方法以一个时间序列T和子序列长度m作为输入,输出一个矩阵轮廓和矩阵轮廓索引。整个限定motif挖掘过程如图3a所示。根据输出的矩阵轮廓,选择其最小值对应的索引作为motif的起始位置,向后延伸m长度得到motif,图3b中阴影部分表达了挖掘出的motif。
1.3.3 海洋热浪事件的定义
目前,对于海洋热浪事件都通过基于SST阈值的方法去定义,获取用于识别热浪事件的阈值主要有两种方法:一种是直接给出特定的阈值,即绝对阈值,例如可以参考环境要素的影响程度给出该阈值;另一种是基于概率统计分析计算得到判定阈值,称为相对阈值,主要运用于具有显著空间差异的环境要素。从技术方法和参考意义上考虑,本文选择相对阈值作为判别热浪事件的依据,具体为海表温度的90%分位数(图4a),热浪事件定义为SST超过该阈值且持续天数达5天以上的情况(图4b)。在挖掘motif的过程中,加入海洋热浪事件的约束作为限定条件:(1)motif必须出现在热浪事件频发时期;(2)motif序列必须在高温阈值线以上。
1.3.4 MDL评分策略
最小描述长度(minimum description length,MDL)原理[27]是Rissane在研究通用编码时提出的,其核心思想是建立精确描述对象的数学模型,并在模型描述的高精确性和低复杂性之间取一个最好的折中。MDL通常用于解决离散数据的相似问题,而本文将MDL评分策略运用于对时间序列关联规则的评分。首先选一个候选时间序列作为假设H,这个假设H需要耗费一些比特数来存储它,把假设H的存储成本表示为描述长度DL(H),如果把该序列存储为最简单的整数数组,那么有DL(H)=length(H)log2(cardinality),其中cardinality为基数,根据以往的经验[28],基数的值选取为16效果较好。给定假设后件H,一个匹配序列m的描述长度可以表示为DL(m|H),计算DL(m|H)可以分两步:先用匹配序列m的描述长度减去后件,再编码这个差分矢量。因此,候选子序列m在假设H下节约的存储空间可以作为对m的评分为:
$$ \mathrm{b}\mathrm{i}\mathrm{t}-\mathrm{s}\mathrm{a}\mathrm{v}\mathrm{e}\left(m,H\right)=DL\left(m\right)-DL\left(m\right|H) $$ (4) 为了避免偶然性,满足同一规则的数据至少出现两次。为了评估假设H,我们必须衡量它和一个后件集合的匹配度,这个后件集合的大小至少为2,对于每个候选规则的后件序列,都有自己的存储代价,即DL(m),并且每一个候选序列都有对应的误差代价DL(m|H)和共有的模式代价DL(H)。因此,对于同一规则,总评分可以用公式(3)表示为:
$$ \text {total} - \text {bit} - \operatorname{save}(M, H)=-D L(H)+ \sum_{ {m \in M }} \text {bit} -\operatorname{save}(m, H) $$ (5) 式中:集合M包括所有用结果H压缩得到的子序列。根据缩减描述长度的定义,缩减描述长度越小,那么模式代价和误差代价的和越小,说明H和每一个m越相近,total bit save评分越高。
2 结果与讨论
2.1 SST数据滤波处理结果与讨论
图5显示了ZLG站点SST时间序列在不同参数下对应的HP滤波处理效果。RAVN 等人[28]对改变观测频率时如何调整HP滤波器的平滑参数进行了分析研究,提出该参数应根据观测频率变化的四次方进行调整,SST时序数据是具有季节周期性的数据,根据该研究结论,λ取1600时产生的趋势效果最好。
2.2 motif挖掘结果与讨论
如图6所示,阴影部分为3个站点SST数据的motif挖掘结果。由图可知,motif均在热浪事件发生的区间内(红线代表90%分位数阈值线,下同),表明该挖掘结果有效。
2.3 海洋热浪事件模式发现结果
海洋热浪事件模式是表达事件发生前和发生时海表温度变化规律的关联规则。本文使用STAMP算法在SST时序数据上进行motif挖掘后,遍历整个序列寻找与motif相似度在阈值范围内的其余子序列,产生更多的motif,并基于motif分割和MDL评分函数形成关联规则。参数设置为:时间序列长度m,motif的长度n,motif划分为前件和后件的分割参数s,s的范围是0.1~0.9。实验共产生了33条规则,部分规则如图7所示。当分割参数s设置为0.3时,MDL评分最高,total bit save=37,即规则的划分效果最好。
根据热浪事件阈值的定义,取海表温度的90%分位数作为阈值,图8显示了ZLG站点2018-2019年热浪事件的发生情况,蓝色虚线表示阈值线,蓝线虚线以上部分代表热浪事件的发生时间段。结合热浪事件的约束条件,模式必须要在热浪事件发生的区间内,所以将关联规则的范围限定在区间[ts, te]。如图8所示,规则的限定区间为[2018-05-21,2018-09-21]和[2019-08-09,2019-10-06],如果规则出现在限定的区间内,那么我们认为该规则是有意义的,否则舍弃。在图7c中,当分割参数s为0.3时,MDL评分最高,且在限定范围内的规则有两条,前件的位置177(2018-06-27)和592(2019-08-16),所以这两条规则是有意义的。图9a是ZLG站点处的热浪事件模式,图9b将该模式在整个SST时序数据上进行了可视。ZLG站点位于南海,1982-2018年期间,南海MHW受到厄尔尼诺南方涛动(ENSO)的强烈调节[5],具有显著的周期性特征。LIU等人[5]通过统计分析的方法揭示了季节性特征,夏季的MHW持续时间相对最长,其原因可能是ENSO引起的WNP反气旋的相位锁定。从图9b可以看出,在经过15天左右的升温间歇期后发生了持续40多天的海洋热浪,且具有显著的周期和季节特征,连续两年在夏季都发生了严重的热浪事件。以相同的方法对LHT和DCN站点的SST数据进行了分析,图10是LHT站点处的热浪模式,LHT站点位于大连市,濒临渤海,渤海的MHW频率、持续时间和平均强度均高于全球平均值的两倍[4]。从图10中可以看出,2017年和2018年LHT站点发生了持续时间高达35天的海洋热浪事件,且升温速率非常快,这两次严重的MHW事件导致了“2017年獐子岛扇贝事件”和“2018年海参死亡事件”两起著名的海洋渔业灾难。图11是DCN站点处的海洋热浪模式,该站点位于东海,东海是太平洋的一个边缘海,向北与南黄海相连(沿中国长江口至韩国济州岛的一段),并通过台湾海峡和琉球群岛与南中国海和菲律宾海隔开,被称为全球最发达的大陆架地区之一。近40年来,东海经历了稳定的变暖趋势,2017-2019年连续3年,受洋流的热平流的影响发生了极端海洋变暖事件,即海洋热浪,2017年8月SST的异常更为强烈,覆盖了ECS更广泛区域,随后2018年又是一个温暖的夏天[29],这三个连续温暖的夏天,包括两个破纪录的夏天。图11显示2017年和2018年均发生了长达30天的海洋热浪事件。
2.4 海洋热浪事件模式的验证
关联规则是海洋热浪事件模式的表达,而motif是关联规则形成的基础,为了验证海洋热浪事件模式的重复性,通过观察长时间序列数据集来寻找类似的motif。通过对2020年ZLG站点SST时序数据的motif挖掘,验证了上文中挖掘的海洋热浪事件模式是一种重复的变化趋势。在图12a中将挖掘获得的结果进行可视化,可以看出热浪事件(红线以上的阴影区域)发生前,SST呈先降低后升高的趋势,变化规律与2019年相同。在图12b中,也对该站点2016-2017年的数据进行了motif挖掘,结果与之前的挖掘结果相同,在海洋热浪事件发生前,海表温度的变化趋势都会呈现先下降后升高的趋势。
2.5 海洋热浪事件预测
利用本文的海洋热浪模式发现方法,实现海洋热浪预测的过程为:在没有完整的时间序列的情况下,将挖掘出的热浪模式前件与当前已监测出的SST数据序列进行匹配,如果相似性很高,则意味着即将发生海洋热浪事件。如图13所示,为本文算法挖掘出的海洋热浪模式,红色子序列表示模式的前件,蓝色子序列表示模式的后件。具体预测时,以该模式的前件(图13中红色子序列)去匹配当前已监测到的SST序列,如果当前SST的变化趋势与模式的前件匹配,则意味着即将发生海洋热浪事件。本文基于ZLG站点5年的SST数据进行预测实验,如图14所示,阴影部分表示海洋热浪实际发生的时间区间,ZLG站点5年共发生了9次热浪事件。将发现的模式前件,与ZLG站点监测的SST数据进行了匹配,共匹配识别出7个相似的前件(图14中的红色子序列),即利用本文方法可准确预测7个海洋热浪事件,预测准确率为78%。
3 结 论
本文结合3个具有典型代表性的站点SST数据分析表明,中国近海的海洋热浪具有季节特征,主要发生于夏季,且持续时间达20天以上,海洋热浪模式表现为有规则的升温和下降趋势,升温速率和降温速率呈对称特性,且在热浪发生前,SST有短暂的升温间歇期,下降1 ℃后持续上升。根据该模式特点,对ZLG站点的MHW发生情况进行了预测,预测准确率达78%。在后续的工作中将致力于研究海洋多要素数据在热浪事件发生前的关联关系以及热浪事件趋势预测等,将挖掘出的潜在信息作为先验知识加入预报模型,更好地辅助海洋热浪事件的预报。
-
-
[1] IPCC. Managing the risks of extreme events and disasters to advance climate change adaptation[M]. Cambridge: Cambridge University Press, 2012.
[2] WU L X, CAI W J, ZHANG L P, et al. Enhanced warming over the global subtropical western boundary currents[J]. Nature Climate Change, 2012, 2(3): 161-166. doi: 10.1038/nclimate1353
[3] OLIVER E C J, DONAT M G, BURROWS M T, et al. Longer and more frequent marine heatwaves over the past century[J]. Nature Communications, 2018, 9(1): 1324. doi: 10.1038/s41467-018-03732-9
[4] YAO Y L, WANG J J, YIN J J, et al. Marine heatwaves in China's marginal seas and adjacent offshore waters: past, present, and future[J]. Journal of Geophysical Research, 2020, 125(3): e2019JC015801. doi: 10.1029/2019JC015801
[5] LIU K, XU K, ZHU C W, et al. Diversity of marine heatwaves in the South China Sea regulated by ENSO phase[J]. Journal of Climate, 2021, 35(2): 877-893.
[6] LI Y, REN G Y, WANG Q Y, et al. More extreme marine heatwaves in the China Seas during the global warming hiatus[J]. Environmental Research Letters, 2019, 14(10): 104010. doi: 10.1088/1748-9326/ab28bc
[7] 齐庆华, 蔡榕硕. 中国近海海表温度变化的极端特性及其气候特征研究[J]. 海洋学报, 2019, 41(7): 36-51. [8] ESLING P, AGON C. Time-series data mining[J]. ACM Computing Surveys, 2012, 45(1): 12.
[9] LI H L. Multivariate time series clustering based on common principal component analysis[J]. Neurocomputing, 2019, 349: 239-247. doi: 10.1016/j.neucom.2019.03.060
[10] LI H L, WEI M. Fuzzy clustering based on feature weights for multivariate time series[J]. Knowledge-Based Systems, 2020, 197: 105907. doi: 10.1016/j.knosys.2020.105907
[11] AGRAWAL R, FALOUTSOS C, SWAMI A. Efficient similarity search in sequence databases[C]//Proceedings of the 4th International Conference on Foundations of Data Organization and Algorithms. Chicago: Springer, 1993.
[12] AGRAWAL R, IMIELIŃSKI T, SWAMI A. Mining association rules between sets of items in large databases[C]//Proceedings of 1993 ACM SIGMOD International Conference on Management of Data. Washington: ACM, 2011.
[13] KEOGH E J, PAZZANI M J. An enhanced representation of time series which allows fast and accurate classification, clustering and relevance feedback[C]//Proceedings of the 4th KDD 1998. New York City: AAAI, 1998: 239-243.
[14] LIN J C W, GAN W S, HONG T P, et al. An efficient algorithm to maintain the discovered frequent sequences with record deletion[J]. Intelligent Data Analysis, 2016, 20(3): 655-677. doi: 10.3233/IDA-160825
[15] DAS G, LIN K I, MANNILA H, et al. Rule discovery from time series[C]//Proceedings of the Fourth International Conference on Knowledge Discovery and Data Mining. New York City: AAAI, 1998: 16-22.
[16] ZHAO Y, ZHANG T T. Discovery of temporal association rules in multivariate time series[C]//Proceedings of 2017 International Conference on Mathematics, Modelling and Simulation Technologies and Applications. Xiamen: DEStech Publications, 2017.
[17] VOLPERT V A, NEC Y, NEPOMNYASHCHY A A. Exact solutions in front propagation problems with superdiffusion[J]. Physica D:Nonlinear Phenomena, 2010, 239(3/4): 134-144.
[18] WU G P K, CHAN K C C. Discovery of spatio-temporal patterns in multivariate spatial time series[J]. ACM/IMS Transactions on Data Science, 2020, 1(2): 11. doi: 10.1145/3374748
[19] SHOKOOHI-YEKTA M, CHEN Y P, CAMPANA B, et al. Discovery of meaningful rules in time series[C]//Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. Sydney: ACM, 2015: 1085-1094.
[20] VAHDATPOUR A, AMINI N, SARRAFZADEH M. Toward unsupervised activity discovery using multi-dimensional motif detection in time series[C]//Proceedings of the 21st International Joint Conference on Artificial Intelligence. Pasadena: Morgan Kaufmann Publishers Inc., 2009: 1261-1266.
[21] BROWN A E X, YEMINI E I, GRUNDY L J, et al. A dictionary of behavioral motifs reveals clusters of genes affecting Caenorhabditis elegans locomotion[J]. Proceedings of the National Academy of Sciences of the United States of America, 2012, 110(2): 791-796. doi: 10.1073/pnas.1211447110
[22] MUEEN A. Time series motif discovery: dimensions and applications[J]. WIRES Data Mining and Knowledge Discovery, 2014, 4(2): 152-159. doi: 10.1002/widm.1119
[23] HODRICK R J, PRESCOTT E C. Postwar U. S. business cycles: an empirical investigation[J]. Journal of Money, Credit and Banking, 1997, 29(1): 1-16. doi: 10.2307/2953682
[24] YEH C C M, ZHU Y, ULANOVA L, et al. Matrix profile I: all pairs similarity joins for time series: a unifying view that includes motifs, discords and shapelets[C]//Proceedings of the 2016 IEEE 16th International Conference on Data Mining. Barcelona: IEEE, 2016: 1317-1322, doi: 10.1109/ICDM.2016.0179.
[25] SAHA P, NATH P, MIDDYA A I, et al. Improving temporal predictions through time-series labeling using matrix profile and motifs[J]. Neural Computing and Applications, 2022, doi: 10.1007/s00521-021-06744-7.
[26] HOBDAY A J, ALEXANDER L V, PERKINS S E, et al. A hierarchical approach to defining marine heatwaves[J]. Progress in Oceanography, 2016, 141: 227-238. doi: 10.1016/j.pocean.2015.12.014
[27] GRUNWALD P D, MYUNG I J, PITT M A. Advances in minimum description length: Theory and applications[M]. Cambridge: MIT Press, 2005.
[28] RAVN M O, UHLIG H. On adjusting the hodrick-prescott filter for the frequency of observations[J]. The Review of Economics and Statistics, 2002, 84(2): 371-376. doi: 10.1162/003465302317411604
[29] GAO G D, MARIN M, FENG M, et al. Drivers of marine heatwaves in the East China Sea and the South Yellow Sea in three consecutive summers during 2016–2018[J]. Journal of Geophysical Research, 2020, 125(8): e2020JC016518. doi: 10.1029/2020JC016518
-
期刊类型引用(0)
其他类型引用(1)