使用主动学习加速机器学习

一篇 medium 文章的渣翻

https://becominghuman.ai/accelerate-machine-learning-with-active-learning-96cea4b72fdb

让我们讨论一下主动学习。我相信这个方法可以极大的增速,以及减少许多机器学习工程的花费。这篇文章我将从两个部分说明这个问题。在第一部分,我给出了一个极高的层级的主动学习的说明,以及如何把它利用到机器学习工程中。在第二部分,深入到一个主动学习 demo 中。

[阅读全文]

批量转换ipynb

一段脚本将ipython notebook转化为py文件。

It’s hard to make notebook file to import so it’s important to make notebook importable.

#!/usr/bin/env python
# coding: utf-8
import nbformat
from nbconvert import PythonExporter
def convertNotebook(notebookPath, modulePath):
  with open(notebookPath) as fh:
    nb = nbformat.reads(fh.read(), nbformat.NO_CONVERT)
  exporter = PythonExporter()
  source, meta = exporter.from_notebook_node(nb)
  with open(modulePath, 'w+') as fh:
    fh.writelines(source)
def trans_all():
    import os
    path = '.'
    list_dirs = os.listdir(path)
    for filename in list_dirs:
        if filename.endswith('.ipynb'):
            print(filename, filename[:-5] + 'py')
            convertNotebook(filename, filename[:-5] + 'py')
trans_all()

Keras坑

使用Keras做分类的时候踩了一个坑,也是拿来主义的锅,估计也有不少同志遇到。

在进行分类的时候,往往使用categorical_crossentropy,有时候萌新(像我)会用binary_crossentropy,虽然结果可能上浮30%,但是这个结果是不对的。model.fit以及model.evaluate给出的acc的值都是有问题的,正确的计算方法应该是:

[阅读全文]