1. Independence

    Independence 独立性,是用于处理大量随机变量的重要工具。 利用独立性,我们可以同时对大量的独立变量进行估计。

    read more

    There are comments.

  2. novelty detection

    Novelty detection (异常检测)是一个不好定义的问题。这个问题形容那些不寻常(unusual)的观测情况。 选择哪些东西作为“不常见”这件事情,本身是非常主观的。因此,大部分常见的观点是,很少出现的情况,就是不寻常的。

    read more

    There are comments.

  3. regression

    Regression (回归)问题是另一类经典问题。回归问题的目标是在给定\(x\)的基础上,给出\(y \in R\)的估计。 一个例子是股票:股票每天的股价都是不一样的,我们希望得到股票的价格;运行员的心跳次数;加速器的数据等等。

    read more

    There are comments.

  4. structure_estimation

    Structured Estimation 主要描述如何对\(y\)进行合适的设计。 在不同的背景下,\(y\)所表达的意义是不同的。 当对网页进行分类的时候,\(y\)可能是本体(ontology)的一条路径; 当尝试匹配对象的时候,\(y\)可能是一个置换。

    不同的问题具有自己的属性;我们会有一个可以接受的\(y\)的形式,并且在这个形式下搜索解空间。

    read more

    There are comments.

  5. multiclass-classification

    多分类问题是二分类问题的一个逻辑拓展。 主要的区别是,\(y\in\{1,...,n\}\),y取值于一个范围。 例如,我们可能需要对一个文档所用的语种进行分类,这个分类包含英语,法语,德语,中文等等。

    read more

    There are comments.

  6. Problems-3

    • 当我们允许选择一部分\(X\)来构建模型时,这称之为主动学习。
    • 我们可能没法办法得到全部的\(X\)的数据,有些数值可能是缺失的。这导致了数据估计的缺失问题。
    • 数据\(X\)和数据\(X'\)可能来自不同的数据源,这导致了 covariate shift correction 问题
    • 两个问题可能具有相互影响的边际信息(side information),这称之为co-training
    read more

    There are comments.

  7. Problems-2

    1. 我们能够看见连续序列\((x_i,y_i)\),需要对\(y_i\)进行估计,这一般称之为在线学习(online learning)。
    2. 集合\(X:=\{x_1,...,x_m\}\)与集合\(Y:=\{y_1,...,y_m\}\)\((x_i, y_i)\)成对,需要预测\(y\),这个\(y\)与从未见过的序列\(X':=\{x'_i, ..., x'_m\}\)成对。这一般称之为批学习(batch learning)。注意:batch 经常被翻译为“批”,计算机术语中的“批”往往都是有关联的。
    3. 我们可能在构建模型的时候就能见到\(X'\),这称之为transduction(转导)。
    read more

    There are comments.

  8. Problems

    二分类问题是一个被研究最多的问题之一。 比较常见有:邮件是否是垃圾邮件,一个水果是苹果还是橘子。

    read more

    There are comments.

  9. Data

    机器学习中的数据可能有各种形式,包括向量,列表,集合,矩阵,图像(也可以认为是一种矩阵), 视频,树和图,Strings,以及混合结构。

    read more

    There are comments.

« Page 2 / 3 »

links

social