EEG Feature Selection via Global Redundancy Minimization for Emotion Recognition 论文笔记

概述

提出了一种基于最小化全局冗余的特征提取算法(global redundancy minimization in orthogonal regression)。

研究动机

基于EEG的情绪识别研究大多使用低密度(小于128个通道)的EEG数据，如SEED [71]和DEAP[72]数据库。低密度脑电图的缺点是其空间分辨率差。随着脑电设备的发展，高密度脑电(超过 128个通道)因其高空间分辨率在情绪识别领域受到越来越多的关注。与低密度脑电信号相比，高密度脑电信号可以为情绪识别任务提供更丰富的空间信息。但基于EEG的情绪识别数据 [16]、[17]的样本量小，高维EEG特征容易导致分类器过拟合和情识别性能差。

在现有的研究中[26]，[47]，高度相关特征的特征排名往往是几乎相等的，因为它们被认为对分类任务[26]，[47]同样重要。结果表明，在选取的特征子集中，得分最高的多个EEG 特征相互依赖、互为冗余[48]。由冗余的EEG特征不能提供额外有用的信息用于情绪识别，应该被去除[30]。

mRMR[20]和CMIM 方法[49]能在一定程度上最小化所选特征子集中的冗余信息。然而，因为采用贪心策略评估特征相关性，因此无法实现全局冗余最小化，所选择的EEG特征子集不是最优输出 [47]，[48]。

解决方案

针对这一问题，文章提出了一种新的EEG特征选择方法，即基于正交回归的全局冗余最小化(GRMOR)。引入了一个全局冗余评估项来计算EEG特征与其他特征的冗余之和。该方法能有效地从全局角度识别冗余脑电信号，进而获得具有鉴别性的非冗余脑电信号特征子集。

GRMOR 方法将全局冗余信息引入正交回归以准确评估冗余信息高度相关的 EEG 特征之间的关系。 GRMOR 是最小化以下问题：
$\begin{aligned} &\min _{W, \mathbf{b}, \theta}\left\|W^{T} \Theta X+\mathbf{b} \mathbf{1}_{n}^{T}-Y\right\|_{F}^{2}+\lambda \boldsymbol{\theta}^{T} A \boldsymbol{\theta} \\ &\text { s.t. } W^{T} W=I_{k}, \boldsymbol{\theta}^{T} \mathbf{1}_{d}=1, \boldsymbol{\theta} \geq 0 \end{aligned}$
其中，A为冗余特征矩阵（从公式上看像是一个魔改的余弦相似度，矩阵中的每个元素代表两个特征间的相似程度/冗余程度），W是正交约束的投影矩阵。 $\Theta$ 和 $\theta^T1_d=1,\theta > 0$ 是对角矩阵。
$A_{i, j}=\left(B_{i, j}\right)^{2}=\left(\frac{\mathbf{f}_{i}^{T} \mathbf{f}_{j}}{\left\|\mathbf{f}_{i}\right\|\left\|\mathbf{f}_{j}\right\|}\right)^{2}$

$\left\{\begin{array}{l} \mathbf{f}_{i}=H \mathbf{x}_{i}^{T} \\ \mathbf{f}_{j}=H \mathbf{x}_{j}^{T} \end{array}\right.$

$H=I_{\mathrm{n}}-\frac{1}{n} \mathbf{1}_{n} \mathbf{1}_{n}^{T}$

优化算法：

算法4.交替优化W（GPI[69]）， $\Theta$

算法说明：先固定 $\Theta$ 优化W，使用GPI算法。再固定W，优化 $\Theta$ ，过程中使用了增广拉格朗日法对式子进行表换，通过算法3对 $\Theta$ 进行优化。

为什么可以解决

为了说明GRMOR方从全局角度最小化冗余的机理，Eq.(11)中的全局冗余最小化项θ ta θ可以转化为∑d i,j=1 Ai,jθi。GRMOR方法首先采用基于正交回归的误差最小项对EEG特征xi和xj的权重进行评分。Ai,j的大值表示EEG特征xi与 xj高度相关。当θi > θj时，θj将变小到使全局冗余项最小化。也就是说，当向量xi和xj互为冗余时，在迭代优化目标函数的过程中，θj的值减小，θi的值保留。

上面是原文翻译，以下为个人复述:

因为A是不变的，当 $A_{i,j}$ 的值很大时，证明两个特征高度相关，此时两个特征互为冗余，当 $\theta_i>\theta_j$ 的时候 $\theta_j$ 会变小，从而在后期对特征进行排序，达到去冗余的目的。

实验

数据集

DEAP、SEED 、HDED。

DEAP：音乐诱发，32通道

SEED：视频诱发，62通道

HDED：文章自行采集的128通道数据，视频诱发。

**实验范式 **

在实验中，参与者被要求以一种舒适的方式放松地坐着，并保持长时间的注意力。每个实验对象依次观看12个电影片段。12个电影片段对应12个试验的脑电图数据，每个试验包括以下步骤:

(1)一个视频播放前5秒开始提示。

(2)一个电影片段3-5分钟的显示。

(3)观看电影后50秒内对性兴奋和效价进行主观自我评价。

(4)下一段影片前15秒的短暂休息。实验过程如图1所示。共有12个试验，每个受试者的脑电图数据。脑电图记录由经验丰富的神经生理学专家进行检查。

实验流程

数据处理：eeg数据经1 - 50hz带通滤波器预处理。然后进行独立成分分析以去除生理伪影。没有进行切分。
数据特征：12种。EEG信号分为5个频率范围:delta频带(1- 4hz)、theta频带(4- 8hz)、alpha 频带(8- 13hz)、beta频带(13- 30hz)和gamma频带 (30- 50hz)[77]。

效果

在3个数据集中与其他9种常见的特征提取算法进行对比，取得最好结果。

局限性

在半监督以及无监督学习中不一定有效。