对session进行评估,判断其是否适合使用迁移学习来提升性能。阅读重点,如何cross-subject。
全文核心:文中提出了一种新的可被迁移性的度量指标LSG,可以衡量一组数据是否适合接受来自其他被试的数据。全文理论基于一个假设,就是当一个session的数据可以很好地训练模型的时候,其他被试的数据将不能提供任何有用的帮助(原文:In this study, we hypothesized that if the pilot session of an individual provides discriminative information between alertness and drowsiness for the session and for sessions from others, then the information from others might not add any value to improve the model based solely on the pilot session for the individual.)。相反,当一个模型还不能很好地拟合数据地时候,它是可以接受外界数据辅助训练的。(原文:Conversely, if the pilot session is not informative enough to model the drowsiness level, and is neither generalizable to predict the drowsiness level of sessions from others, then the model for this individual might benefit from the transfer learning procedure. )
L
S
G
i
=
P
(
i
,
i
)
+
P
(
l
,
Φ
(
l
)
)
‾
P
(
J
,
J
)
+
P
(
J
,
Φ
(
J
)
)
‾
‾
∣
j
∈
Φ
(
i
)
L S G_{i}=\frac{P(i, i)+\overline{P(l, \Phi(l))}}{\left.\overline{P(J, J)+\overline{P(J, \Phi(J))}}\right|_{j \in \Phi(i)}}
LSGi=P(J,J)+P(J,Φ(J))∣∣∣j∈Φ(i)P(i,i)+P(l,Φ(l))
对公式的理解:可见,分子为一个session训练后的模型对它自己的表现,以及对其他session的表现(以中位数代表)。分母为所有session的同样计算的中位数。因此,
L
S
G
i
LSG_i
LSGi可以理解为在所有session中,session
i
i
i所包含的信息是否足够训练自己的模型,以及对外来信息的接受空间大小,LSG越小,则越能接受来自其他被试的数据的迁移。
如何做到cross-subject的?
基于他们所提的假设所推得当一个session的信息不足以训练其自身的分类器时,它是可以从外界接受辅助的。也就是LSG低(<1)的session可以接受来自其他被试的数据辅助训练。