目录
- 另外一种页面内链接方法 点这里从头再读一遍
Github/编辑
名词解释 解释(代码引用示例之一)select * from table where a=3 limit 10;
备注信息:
- Git简易指南,图说Git,git文件状态和工作区域

- 【2018-7-24】Git交互式在线学习,最好的实战教程,图例:

- github官方markdown指南
- github readme语法简介,【2018-6-10】github page jeklly主题,【2019-04-29】Jeklly主题大全
- MarkDown语法笔记(完整版)
- 马克飞象markdown语法在线测试
- Latex在线调试
- Markdown如何插入目录
- 【2019-03-17】富文本转markdown在线编辑器,Markdown在线编辑器
macbook配置
- 汇总
| 功能 | 方法 | 备注 |
|---|---|---|
| 终端用户名自定义 | 系统偏好设置->共享->编辑电脑名称 | - |
| 画图工具OmniGraffle+Pro | 6下载地址,注册码;7下载地址(含许可证) | 兼容viso,功能强大 |
| Mac Office 2016破解 | 操作简单,安装完mac office正式版后,下载破解文件,双击锁,就可以 | 参考地址 |
| Mac下安装Windows | Mac电脑上用VMware Fusion安装Windows7 | 提前下载vmware+Windows安装包,添加Windows虚拟机后默认无法启动,需要单独指定iso镜像位置,再重启即可 |
| 画图工具OmniGraffle+Pro | 6下载地址,注册码;7下载地址(含许可证) | 兼容viso,功能强大(【2017-12-6】注:7.4版才能用许可证,7.5以上不行) |
| 安装pip | sudo easy_install pip | pip直接安装其他工具 |
| 软件包管理器 | homebrew安装(参考地址);安装wget:brew install wget | brew安装命令:ruby -e ”$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)“ |
| 翻墙 | 1.有代理ip的直接设置:网络->高级->代理->勾选网页代理+安全网页代理,输入服务器域名及端口,无需填入账号。2.用lantern下载 | 备选方案很多 |
| vim颜色显示 | 1.vim ~/.vimrc,2.添加colorscheme desert;syntax on | vim sublime颜色主题 |
| vim开发环境 | vim IDE部署 | 其他主题包,[vim-go开发环境[(http://blog.csdn.net/chosen0ne/article/details/40782991) |
| shell目录颜色显示 | 开启方法:编辑~/.bash_profile,增加:export CLICOLOR=1;export LSCOLORS=exfxaxdxcxegedabagacad | 注:如何在shell字符串中显示彩色字符?,显示白色:echo -e “\033[37m white \033[0m” |
| mac免密码远程登录 | 使用ssh创建rsa公钥密码。基本步骤:* 1.ssh-keygen生成密钥(ssh-keygen -t rsa) * 2.复制密钥文件到远程机器(scp ~/.ssh/id_rsa.pub wangqiwen@ip.com:/home/wangqiwen/.ssh) * 3.登录远程机器,修改文件权限(cd ~/.ssh && cat id_rsa.pub >> authorized_keys; chmod 644 authorized_keys;chmod 700 ~/.ssh/) | 参考地址:mac无密码登录,Linux 下 SSH 命令实例指南,菜鸟学Linux命令:ssh命令 远程登录 |
| ssh会话管理 | ssh配置文件实现别名快捷登录,【2018-9-29】图解ssh及登录原理 | |
| chrome浏览器中右键失灵 | 双指触碰链接时,并未弹出右键菜单,而是“图片另存为” | 解决办法:这是由于chrome浏览器上开启了鼠标手势,造成干扰,关闭或删除插件即可 |
| image not recognized | dmg文件无法安装,原因:文件损坏,dmg权限不允许任意来源的包;换浏览器 | 如何开启任意来源包?sudo spctl —master-disable |
| redis安装 | brew install redis | 使用方法:启动服务,redis-server,连接服务:redis-cli |
| mac mail客户端设置 | 连接163时,需要先去163邮箱开启pop3/imap选项,通过手机验证码设置连接密码;mail终端配置时填入的密码是连接密码(非登录密码!) | wqw3721 |
| 安装虚拟机 | vmware安装,下载地址 | vmware fusion 8激活码:FY75A-06W1M-H85PZ-0XP7T-MZ8E8,ZY7TK-A3D4N-08EUZ-TQN5E-XG2TF,FG1MA-25Y1J-H857P-6MZZE-YZAZ6 |
| Mac下运行Windows软件 | (1)boot camp安装Windows虚拟机(win 10文件过大);(2)安装wine | 步骤:(1)brew cask install xquartz(2)brew install wine |
| java | 官方下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html | 优先使用绿色版(tar.gz,非二进制的rpm)。环境变量配置方法:修改/etc/profile文件,在文件的最下边加入下边的文本:export JAVA_HOME=/opt/jdk1.7; export CLASSPATH=.:JAVA_HOME/lib/dt.jar:JAVA_HOME/bin:$PATH |
| Web服务 | Mac OS 启用web服务,简网教程 | |
| linux 服务器mail | mail command not found | 解决方法:sudo yum install mailx;echo “test” (竖线) mail -s “content” wangqiwen@p1.com |
| linux下安装http服务 | 安装httpd | 1.yum install httpd -y 2.随系统启动:chkconfig httpd on 3.开启Apache:service httpd start |
| terminal下如何开启应用? | 用open命令开启(open .用finder打开当前位置目录;open file自动调用默认程序打开文件;say hello语音说话),可以传参,备注:放到别命中,alias view=‘open /Applications/Preview.app’或alias edit=‘open /Applications/Sublime\ Text.app’ | open /Applications/Sublime\ Text.app README.md |
| shell美化 | Oh My ZSH! | 安装:sh -c ”$(curl -fsSL https://raw.github.com/robbyrussell/oh-my-zsh/master/tools/install.sh)“ |
| 刻盘 | Etcher全平台工具 | 操作过程极其简单 |
| 移动硬盘无法写入 | 原因:mac不支持ntfs格式,需要安装特殊软件:ntfs for mac | |
| mac显示当前路径 | 命令:defaults write com.apple.finder _FXShowPosixPathInTitle -bool YES | 顶栏出现路径,还可以点击定位到子目录 |
| mac当前位置打开终端 | 命令:https://jingyan.baidu.com/article/ce436649281a293773afd3d8.html | |
| mac下excel打开csv中文乱码 | 原因是mac底下中文一律utf8编码,而excel文档默认中文是gbk编码,需要单独设置下才行。http://blog.csdn.net/wqdwin/article/details/76058154 | 亲测有效 |
| 【2018-1-11】 | 网易mumu模拟器 | |
| 【2018-1-11】 | mac下安装adb,调试Android | brew cask install android-platform-tools |
| 【2018-6-25】 | crossover mac版 | mac上运行ie浏览器,使用步骤 |
| 【2018-12-25】 | 复制高亮代码到ppt | 方法:notepad++或sublime text插件SublimeHighlight,详见, Plugin commands - Copy Text with Syntax Highlighting |
| 【2019-05-07】 | pycharm专业版激活 |
python使用mysql方法
安装方法
mac下安装MySQL-python 要想使python可以操作mysql,就需要MySQL-python驱动,它是python 操作mysql必不可少的模块。- 下载地址
- 下载MySQL-python-1.2.5.zip 文件之后直接解压。
- 进入MySQL-python-1.2.5目录:
连接mysql
shell 代码,shell脚本中调用sql脚本爬虫
python抓取链接二手房数据
json使用
shell中使用json
- #[2016-12-31] shell中使用json
- 安装:
pip install git+https://github.com/dominictarr/JSON.sh#egg=JSON.sh
- 使用:
可视化
地图数据可视化
- 地图汇
- 5min上手写echarts第一个图标,echarts如何从json文件读数据?
- 【2017-7-30】Google开发的数据可视化web工具Facet Dive,【2018-3-13】可以嵌入jupyter notebook做特征工程可视化分析, 安装方法参考PAIR-CODE,Google AI,【2018-9-11】集成到tensorboard工具中:what-if

- [2018-6-15]数据挖掘软件:weka适用于EDA探索性数据分析,Orange数据挖掘和机器学习软件
- 北大可视化
- 词云生成图悦
- 北大可视化
- [2018-2-28] OLAP可视化分析工具,官网,saiku社区版,安装方法,简介,Kylin, Mondrian, Saiku系统的整合,saiku安装教程

- 【2018-3-5】python+echarts给你的数据做美颜,pycharts安装,官方文档,jupyter notebook中使用pycharts,github代码完整示例,【2019-05-22】pyechart旧版绘图参数介绍-官网没有,效果示例:

- 【2018-9-27】vue组件demo网站,Element UI组件库
- 【2018-9-27】从输入 URL 到页面显示都发生了什么?英文原版,浏览器输入URL后发生了什么

- 深入,浏览器工作原理,浏览器的工作原理:新式网络浏览器幕后揭秘

- 【2018-9-27】在线简历-动态
- 【2018-12-17】python Django快速搭建博客
学习资料
返回目录学习技巧
-
@爱可可-爱生活(新浪微博):
- 互联时代怎么阅读?
- 读书重在结构生长,形成扎实的支撑;
- 碎片阅读重在视野的纳新和扩展,开枝散叶;
- 思考重在提炼和关联,勾画错综的经脉。
- 学习就是如此,由外而内,无广不精,无博不深,但能坚持必有所成。
- 网络阅读的最佳实践,不在“取”,在“舍”,知舍才能知关键,料不在多,有感悟一二足矣。
- 费曼技巧:通过向别人清楚地解说一件事,来确认自己真的弄懂了这件事。参考:号称终极快速学习法的费曼技巧,究竟是什么样的学习方法?
-
- 学习金字塔
- 【2018-7-27】什么是博士?长图

数学基础
返回目录- 【2019-06-18】数学基础概率,来自:深度学习知识大全

- 【2018-12-16】一图解释数学体系-数学深渊
- 可微可导可积连续之间的关系

- 【2019-04-30】微积分的本质
-
- 如何通俗讲解放射变换? _ 在线几何作图GeoGebra(源自 马同学高等数学)
- 3Blue1Brown出品(接受捐助):线性代数的本质-Essence of Linear Algebra-视频教程,Bilibili上《线性代数本质》双语视频教程.类似视频还有微积分本质.制作教学视频的代码

-
-

- 行列式的本质(马同学高等数学).《数学拾遗》英文版百度云地址.
- 矩阵分解(加法偏),矩阵分解(乘法篇),很不错
- 如何通俗的解释放射变换,生动讲解矩阵的空间变换:平移、缩放、旋转、对称(xy或原点)、错切、组合。行列式的本质是什么?---万门大学童哲的解释:行列式就是线性变换的放大率!理解了行列式的物理意义,很多性质你根本就瞬间理解到忘不了!
- 【2018-8-17】广义线性模型是什么鬼?
- 行列式:行列式,记作 det(A),是一个将方阵 A 映射到实数的函数。行列式等于矩阵特 征值的乘积。行列式的绝对值可以用来衡量矩阵参与矩阵乘法后空间扩大或者缩小 了多少。如果行列式是 0,那么空间至少沿着某一维完全收缩了,使其失去了所有的 体积。如果行列式是 1,那么这个转换保持空间体积不变
- 【2017-11-24】遇见数学:图解线性代数
- 六大概率分布
- 最优化算法-避开鞍点
- 【2018-11-15】数说工作室:概率论-上帝的赌术,协和八:说人话的统计学,做统计,多少数据才算够
- 频率学派与贝叶斯学派之争:知乎网友解释,频率学派最先出现,疯狂打压新生的贝叶斯学派,贝叶斯很凄惨,就跟艺术圈的梵高一样,死后的论文才被自己的学生发表,经过拉普拉斯之手发扬光大,目前二派就像华山派的剑宗和气宗。频率学派挺煞笔的,非得做大量实验才能给出结论,比如你今年高考考上北大的概率是多少啊?频率学派就让你考100次,然后用考上的次数除以100。而贝叶斯学派会找几个高考特级教师对你进行一下考前测验和评估,然后让这几个教师给出一个主观的可能性,比如说:你有9成的把握考上北大。
- 这个区别说大也大,说小也小。(1)往大里说,世界观就不同,频率派认为参数是客观存在,不会改变,虽然未知,但却是固定值;贝叶斯派则认为参数是随机值,因为没有观察到,那么和是一个随机数也没有什么区别,因此参数也可以有分布,个人认为这个和量子力学某些观点不谋而合。(2) 往小处说,频率派最常关心的是似然函数,而贝叶斯派最常关心的是后验分布。我们会发现,后验分布其实就是似然函数乘以先验分布再normalize一下使其积分到1。因此两者的很多方法都是相通的。贝叶斯派因为所有的参数都是随机变量,都有分布,因此可以使用一些基于采样的方法(如MCMC)使得我们更容易构建复杂模型。频率派的优点则是没有假设一个先验分布,因此更加客观,也更加无偏,在一些保守的领域(比如制药业、法律)比贝叶斯方法更受到信任。
- 频率 vs 贝叶斯 = P(X;w) vs P(X|w) 或 P(X,w)
- 频率学派认为参数固定,通过无数字实验可以估计出参数值——客观;
- 贝叶斯学派认为参数和数据都是随机的,参数也服从一定的分布,需要借助经验——主观
- 【2018-8-13】贝叶斯概率模型一览,贝叶斯概率-精简讲解
- 【2018-8-16】可视化讲解贝叶斯推断
- 【2018-9-7】深度学习与贝叶斯暑期培训教程DeepBayes,含ppt、视频,github地址:Seminars DeepBayes Summer School 2018,video视频,slides资料
- 【2018-11-30】透彻理解马尔科夫蒙特卡洛,马尔科夫链可视化讲解Markov Chains
- 【2018-11-29】透彻理解最大似然估计
- 统计学基础知识【脑图笔记】
- 大矩阵相乘:分布式版本,MapReduce实现矩阵相乘,Hadoop实现大矩阵相乘之我见
- A大B小(内存受限)

- AB都大(内存受限)

- 不受内存限制(最小粒度)

- A大B小(内存受限)
- Colah的Visual Information Theory,中文翻译
- 【2017-11-24】遇见数学,图解普林斯顿微积分系列
- 【2018-8-16】精品:可视化交互式讲解概率论
- 【2018-9-25】数学的深渊图
- 【2018-9-30】再谈MCMC方法
- 【2018-11-30】理科生大战心灵鸡汤,20个数学案例
- 【2019-04-09】可交互数学课本Mathigon,github地址
- 【2019-07-09】精品:傅里叶变换交互式入门
- 【2019-07-15】马同学高等数学:如何通俗讲解牛顿法
- 切线方程:
计算机基础
- 【2018-5-1】数据结构总结篇_
- 排序算法总结:视觉感受常见排序算法

- 【2017-8-1】排序算法可视化对比Sorting Algorithms Animations,日本程序猿做的排序动画,舞动的排序算法【舞蹈视频】
- 【2018-4-28】算法可视化网站Visualgo,包含动画演示+伪代码,旧金山大学的数据结构算法可视化
- 【2019-05-30】基础算法可视化algorithm-visualizer,GitHub地址,演示地址
- 【2019-06-18】算法导论C++实现
- 海量数据处理算法总结【超详解】
- 水库抽样算法精简,空间亚线性算法
- 【2019-07-18】逆采样(Inverse Sampling)和拒绝采样(Reject Sampling)原理
- 【2019-06-06】程序员小吴的图解Leetcode
- 【2019-06-10】LeetCode 代码实现
- 【2019-06-18】代码体系概览,摘自Leetcode题集
分布式计算
推荐系统
- 项量:关于LDA,pLSA,SVD和Word2vector的一些看法:
- SVD算法是指在SVD的基础上引入隐式反馈,使用用户的历史浏览数据、用户历史评分数据、电影的历史浏览数据、电影的历史评分数据等作为新的参数
- LSA最初是用在语义检索上,为了解决一词多义和一义多词的问题,将词语(term)中的concept提取出来,建立一个词语和概念的关联关系(t-c relationship),这样一个文档就能表示成为概念的向量。这样输入一段检索词之后,就可以先将检索词转换为概念,再通过概念去匹配文档。在实际实现这个思想时,LSA使用了SVD分解的数学手段.x=TSD
- PLSA和LSA基础思想是相同的,都是希望能从term中抽象出概念,但是具体实现的方法不相同。PLSA使用了概率模型,并且使用EM算法来估计P(t|c)和P(c|d)矩阵.LDA是pLSA的generalization:一方面LDA的hyperparameter设为特定值的时候,就specialize成pLSA了
- NMF:一种矩阵分解,要求输入矩阵元素非负,目标和 SVD 一样。
- pLSA:SVD 的一种概率解释方法——要求矩阵元素是非负整数。LDA:pLSA 加上 topics 的 Dirichlet 先验分布后得到的 Bayesian model,数学上更漂亮。为什么是 Dirichlet 先验分布,主要是利用了 Dirichlet 和 multinomial 分布的共轭性,方便计算。
- 【2018-8-2】LDA:无监督,文本主题模型,pLSA的贝叶斯版本。【精】一文详解主题模型LDA,简述LDA主题模型
- 从item-base到svd再到rbm,多种Collaborative Filtering(协同过滤算法)从原理到实现
- 案例分享:世纪佳缘推荐系统经验分享
- 《推荐系统实践》阅读笔记:LFM模型、图模型、slop one和SVD算法
- 实时推荐系统
- 【2019-04-22】从FM推演各深度CTR预估模型-含代码,覆盖CTR预估的前因后果,FM,DeepFM, NFM, DIN, AFM, DCN
机器学习
返回目录特征工程
- 江湖名言:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已
- 知乎:特征工程到底是什么
- 使用sklearn做特征工程
- 使用python进行描述性统计
- 使用sklearn优雅的进行数据挖掘
- 使用sklearn进行集成学习:理论,实践
特征工程常用方法:

- 不平衡数据集如何处理?研究表明,在某些应用下,1∶35的比例就会使某些分类方法无效,甚至1∶10的比例也会使某些分类方法无效。
- 分类问题中不平衡数据集的解决方案,正负样本玄虚
- 1.过抽样:简单赋值负样本——最常用,容易过拟合,SVM模型里用途不大
- 2.欠抽样:随机减少正样本——造成信息丢失
- 3.算法层面:(1)重构训练集,按错分代价对训练集重构(2)代价敏感函数,大样本高代价,小样本低代价
- 4.特征选择:选取有区分度的特征
- 解决真实世界的问题:如何在不平衡数据集上使用机器学习,非平衡数据机器学习,【2019-04-25】如何处理机器学习中的不平衡类别问题-含代码实现

- 【2017-12-25】知乎:机器学习中的测试机和训练集如何划分?,与时间强相关的问题需要按照时间划分,否则(大部分ML问题)应该随机抽样,与时间无关(应用了未来函数)。随机划分保证了训练集和测试集的历史场景是类似的,就类似于这些数据都是同一台机器同一时期产生的两类数据集。这样计算出的准确率能最真实的反映模型对这段数据学习的效果
- 【2018-4-8】[【(Google)机器学习全面入门(96页)】《Jason’s Machine Learning 101》by Jason Mayes] (https://docs.google.com/presentation/d/1kSuQyW5DTnkVaZEjGYCkfOxvzCqGEFzWBy4e9Uedd9k/preview?slide=id.g168a3288f7_0_58), ppt展示google机器学习+深度学习中的应用,含视频
- 【2018-4-15】Google机器学习43条军规,中文版,原版pdf -【2018-5-4】SAP的梁劲(Jim Liang)整理的从基础概念到数学公式,这是一份520页的机器学习笔记(图文并茂),百度云地址,Dropbox地址
- 【2018-5-18】《Random Forests - What, Why, And How》by Andy Liaw, 随机森林解析
基本概念
- 【2018-10-25】偏差(Bias)与方差(Variance), E = B^2 + V + e
,
算法总结
- 微软-ML算法指南:pdf版下载地址
- scikit-learn官方总结,Scikit-learn Cookbook:英文本,中文译本,MarkDown格式。【2018-6-12】scikit-learn中文翻译版,主页,scikit-learn网页版,Github版,wiki版,视频版。sklearn库中文版完全手册下载

- 【2017-12-20】Dlib机器学习指南,方法选择:
,中文版,dlib中文指南-图
- 算法对比 《统计学习方法》总结:【2019-1-23】Python代码

- xgboost: 速度快效果好的boosting模型
- 最优化:各种优化算法对比

- 最优化:各种优化算法对比

- 【2017-8-30】SGD comparision

- SGD,Adagrad,Adadelta,Adam等优化方法总结和比较,An overview of gradient descent optimization algorithms
- 为什么更偏爱随机梯度下降
- 【2017-7-31】10686 一次 CTC-RNN 调参经历

- 【2018-3-5】google 出品的机器学习速成课程,基于tensorflow
- 谷歌新出的jupyter开发环境,免费试用GPU,试用谷歌账号即可,google colaboratory,colaboratory简介,【2019-02-13】Google的colaboratory支持直接从github中导入笔记,地址:http://colab.research.google.com/github/ , 【2018-11-19】Tensorflow官网中文版
- 【2019-06-19】华校专,AI算法工程师手册,包含各类精简笔记
异常检测
- IsolationForest。欺诈等是一系列的异常孤立点,而IsolationForest则是检测这类孤立点的一个有效算法。无需样本标记、线性时间复杂度。一般情况下要比OneClasSVM等表现要好。尤其是对非高斯分布的样本空间。
- 【2017-7-31】反欺诈(Fraud Detection)中所用到的机器学习模型有哪些?:
- (1)可视化:相关矩阵+多维尺度变换
- (2)算法模型:时序相关(时间序列分析)、时序无关(无监督学习Isolation Forest、监督学习one-class SVM、统计学密度估计)
- 【2018-9-12】python异常检测工具包pydor,

机器学习经验总结
- Google机器学习经验总结
- pluskid总结的SVM系列文章(浙大计算机,MIT博士,跟陈天奇和李沐一块做过Mxnet)
- 【2017-8-22】【非常好的web讲解】可视化机器学习(决策树讲解)
- 【2017-8-22】剑桥大学的书籍Introduction to Machine Learning
- 【2017-8-22】Machine Learning is Fun!系列教程。Part 3:Deep Learning and Convolutional Neural Networks,中文翻译:第三章:图像识别【鸟or飞机】?深度学习与卷积神经网络
- 【2017-9-2】维数灾难:精华,维数诅咒,原文The Curse of Dimensionality in classification intel机器学习课程
- 【2017-12-9】Intel AI机器学习课程资料
- 【2017-12-22】图解机器学习(含动图)【2019-04-24】布朗学院出品:交互式图解人工智能AI
- 【2017-12-22】knn原理及代码实现(含kd树),详解kd树
- 【2018-3-23】概率图模型体系:HMM、MEMM、CRF,精华
- 【2018-7-6】Bayesian Methods in Machine Learning – Spring 2018,机器学习中的贝叶斯方法,涉及贝叶斯调参,Radford M. Neal的Bayesian Methods for Machine Learning
- 【2018-7-26】机器学习笔试题精选,原文45 questions to test a Data Scientist on Regression,

- 【2018-7-28】世界最大外文电子书搜索引擎B-OK
- 【2018-8-16】机器学习在线交互式Demo集锦,“Interactive Machine Learning, Deep Learning and Statistics websites”
- 【2018-8-20】机器学习简易入门教程(结合scikit-learn)
- 【2018-8-26】机器学习笔试精选100题(含详细解答)
- 【2018-9-7】8月30日出来的新书:可解释的机器学习Interpretable Machine Learning,破解黑盒秘密
- 【2018-10-29】机器学习500问
- 【2018-11-15】优质自媒体:数说工作室网页版,分类战车SVM
- 【2018-11-15】机器学习十二大经验和准则
集成学习
- 多模型stack方法。参考房价预测解决方案
- bagging,boosting,stacking ,集成学习原理详解,一文读懂集成学习,集成学习Ensemble Learning与树模型、Bagging 和 Boosting、模型融合
- bagging,boosting,stacking ,集成学习原理详解,一文读懂集成学习,集成学习Ensemble Learning与树模型、Bagging 和 Boosting、模型融合
,
,

- 【2018-9-14】使用sklearn进行集成学习
- 【2018-11-27】PRML官方英文版下载地址
流形学习
- 什么是流形学习?传统的机器学习方法中,数据点和数据点之间的距离和映射函数f都是定义在欧式空间中的,然而在实际情况中,这些数据点可能不是分布在欧式空间中的,因此传统欧式空间的度量难以用于真实世界的非线性数据,从而需要对数据的分布引入新的假设。流形(Manifold)是局部具有欧式空间性质的空间,包括各种纬度的曲线曲面,例如球体、弯曲的平面等。流形是线性子空间的一种非线性推广。参考流形学习的简单介绍
-
流形学习:本质上,流形学习就是给数据降维的过程。这里假设数据是一个随机样本,采样自一个高维欧氏空间中的流形(manifold),流形学习的任务就是把这个高维流形映射到一个低维(例如2维)的空间里。流形学习可以分为线性算法和非线性算法,前者包括主成分分析(PCA)和线性判别分析(LDA),后者包括等距映射(Isomap),拉普拉斯特征映射(LE)等。流形学习可以用于特征的降维和提取,为后续的基于特征的分析,如聚类和分类,做铺垫,也可以直接应用于数据可视化等。注:摘自集智百科流形学习(优质,包含代码及案例)。
- 拟合线性的流形学习模型:LLE, LTSA, Hessian LLE, 和Modified LLE
- 拟合非线性的流形学习模型:Isomap,MDS和Spectral Embedding
- 效果示意如下:

- 浙大何晓飞的流形学习ppt,讲的很清楚,全面,最佳资料
降维
- 常见的pca属于无监督,【2017-12-28】【精华】PCA可视化讲解,lda有监督,常用降维方法如下图。
- t-SNE是深度学习大牛Hinton和lvdmaaten(他的弟子?)在2008年提出的,lvdmaaten对t-SNE有个主页介绍:tsne,包括论文以及各种编程语言的实现,t-SNE是非线性方法,非常适用于高维数据降维到2维或者3维,进行可视化,具体参考:t-SNE完整笔记(优质,含Python代码实现),t-SNE原理及python实现.t-SNE交互体验:How to Use t-SNE Effectively;t-SNE CSV web demo,可以直接输入csv数据,【2019-06-24】t-SNE 60min简介,覆盖基础、学术和工程

- [2018-1-29]从SNE到t-SNE再到LargeVis,t-SNE原理最佳资料,深刻讲解
- 其他方法参考流形学习,MNIST数据集降维可视化效果展示(经典). Google高维数据交互可视化Web页面,(TensorBoard 的一个内置的可视化工具 Embedding Projector,可以上传数据文件)
,【2018-1-22】手写汉字识别- 参考:TensorFlow-7-TensorBoard Embedding可视化
- 【2018-8-16】腾讯技术博客火光摇曳的文章:VC维的来龙去脉
- 【2019-2-9】股票预测-随机差分-含代码
- 【2019-07-04】聚类算法对比,sklearn可视化对比

深度学习
返回目录- 【2019-06-18】深度学习资料大全
什么是神经网络
- 【2019-04-30】what is a Neural Network,Youtube地址](https://www.youtube.com/c/3blue1brown?sub_confirmation=1)
-
- 【2019-07-15】神经网络分类面到底什么样?可交互
神经网络发展历史
神经网络网络结构变化
当然,光有强大的内在能力,并不一定能成功。一个成功的技术与方法,不仅需要内因的作用,还需要时势与环境的配合。神经网络的发展背后的外在原因可以被总结为:更强的计算性能,更多的数据,以及更好的训练方法。只有满足这些条件时,神经网络的函数拟合能力才能得已体现
-【2017-8-7】The mostly complete chart of Neural Networks, explained,神经网络结构大全

- 【2019-04-30】神经网络3D仿真视频
-
- 【2017-12-23】神经网络原理视频(十分直观形象),包含3部分,直观理解反向传播
-
- 【2019-05-07】神经网络结构可视化
深度学习大牛
- Geoffrey Hinton :深度学习鼻祖
- Yann Lecun(杨立昆),CNN发明人,Goeffery Hinton的学生,首创LeNet
- Yoshua Bengio :也是深度学习
- Andrew Ng :Hinton的合作伙伴。coursera公开课,Andrew Ng: Deep Learning, Self-Taught Learning and Unsupervised Feature Learning,《MACHINE LEARNING YEARNING》翻译,【2018-10-24】中文翻译版github
- 深度学习四大天王及其关系
-
-
-
- Yann Lecun(杨立昆),CNN发明人,Goeffery Hinton的学生,首创LeNet
- LeNet-5手写数字识别示意图,CNN手写数字识别实时3D交互,能看到详细的参数(非常直观),【2017-8-8】更令人震惊的3D模拟效果(视频)Neural Network 3D Simulation,制作方官网提供的解释,实时视频中的CNN各层效果What convolutional neural networks see,Deep Visualization Toolbox,【2018-7-23】keras.js实现的web端mnist识别Demo包含各种pre-trained模型
- 可视化资料:Google PlayGround神经网络训练在线演示
- 【2017-12-28】汉化版,好玩的神经网络,来自Tensorflow教程网. ConvNetJS两层神经网络实时训练和可视化(可定制网络结构,看隐层空间,作者是Andrej Karpathy),Andrej Karpathy的其他Demo主页
-
【2018-11-30】3D模型可视化框架:TensorSpace:超酷炫3D神经网络可视化框架,
-
- 【2019-03-19】TensorEditor: 一个小白都能快速玩转的神经网络搭建工具
- 神经网络可视化-LaTeX,【2018-3-21】2分钟论文 | 用 谷歌「AI可解释性」 看懂机器学习,Building Blocks of AI Interpretability | Two Minute Papers #234,可视化展示Web地址The Building Blocks of Interpretability
- 资料:Deep Learning(ppt),Manifold
- Google AI实验室,包含多种AI Demo(手写预测,卷积网络可视化,高维数据可视化,autodraw,quickdraw,摄像头物品识别,声音合成,实物翻译,手势控制)。
- 【2017-12-26】AI人工智能不断前进,看神经网络如何玩超级玛丽(视频) -【2017-11-24】卷积核效果在线实验
- 【2017-9-8】Data Science and Robots,Brandon Rohrer.How Deep Neural Networks Work,ppt
- [2017-9-13]Lighthouse:smart camera,video: the future of home
- 【2017-10-11】吴恩达眼中的深度学习七雄
- 【2017-12-22】李沐:博士这五年,动手学深度学习,GPU购买指南,【2018-10-16】博士五年之后五年的总结
- 【2018-7-22】王飞跃教授IJCAI申办记录
- 【2017-8-30】45个问题测出你的深度学习基本功,45 Questions to test a data scientist on basics of Deep Learning (along with solution),深度学习笔试题,神经网络笔试题
-
【2018-11-20】一图概括深度学习核心知识点,如下:
- 【2019-06-18】清华顾险峰(丘成桐学生)的深度学习的几何观点
深度学习书籍
几本有名的书籍: -【2017-8-5】Neural Network and Deep Learning(神经网络与深度学习)- Michael Nielsen,这本书通俗易懂,由浅入深,细致讲解了神经网络,英文版(官网),配套Code,中文版CSDN下载地址,书籍开源,作者求捐助5美元,GitBook中文翻译地址
-【2017-12-13】Deep learning(AI圣经)。
- (1)Deep Learning中文版,英文版,官方slides地址,github中文读书笔记,Deep Learning presented by Ian Goodfellow现场版(youtube).无法翻墙?看bilibili版本
- (2)雷锋网读书会历次分享集合:Deep Learning解读合辑,更完整的集合AI研习社公开课年度盘点
- (3)清华读书会分享笔记(pdf),【2019-05-09】配套代码
| 时间 | 类型 | 名称 | 备注 |
|---|---|---|---|
| Andrew NG | cs229:Andrew NG斯坦福机器学习网易公开课 | 中文字幕 | |
| 台大林轩田 | Machine Learning Foundations官方ppt,Machine Learning Techniques官方ppt,机器学习基石bilibili地址,机器学习技法bilibili视频地址,机器学习基石百度云链接 密码:30p0,机器学习技法百度云链接,密码:nh16 | 【2018-8-16】AI有道,红色石头精心整理-林轩田机器学习资源汇总,Learning from data下载地址 | |
| Hinton | 机器学习和神经网络,网易云课堂 | ||
| chris manning | 斯坦福2017季CS224n深度学习自然语言处理课程 | ||
| 李宏毅 | 李宏毅Machine Learning (2017,秋,台湾大学) | ||
| 牛津 | 深度学习NLP(牛津大学 2017)(英文字幕)bilibili地址 | ||
| andrew ng | deeplearning.ai,神经网络和深度学习,bilibili地址,bilibili汉化系列,黄海广博士写的学习笔记,源自AI初学者—(机器学习爱好者),2014斯坦福机器学习,【2018-9-13】Super VIP Cheatsheet: Machine Learning,深度学习 | deeplearning.ai | |
| andrew ng | 《MACHINE LEARNING YEARNING》翻译, | 2018-4-23 | |
| Ian good fellow | 《深度学习》读书会分享视频集,bilibili地址 | ||
| 普林斯顿 | 普林斯顿-算法 | ||
| 吴恩达 | DeepLearning.ai学习笔记彩绘版,百度云地址 | 很好的资料,作者TessFerrandez的信息图地址,相关github地址 | |
| Google AI 教学系列片 《Cloud AI Adventures》 | |||
| 机器学习概念图示 | 来自Chris Albon博士,英文原版需要12$,中文版百度网盘地址(密码:hje1)由大数据文摘提供 | 参考资料:300张小抄表搞定机器学习知识点 | |
| 语音识别实践 | 解析深度学习:语音识别实践,pdf | 备份pdf链接 | |
| 集成学习 | 周志华:集成学习方法,Ensemble methods Foundations and Algorithms | 下载地址:人大经管论坛,腾讯微云,fee8kn | CNCC 2016 周志华 57 张 PPT 揭开机器学习本质 |
| Judea Pearl | The book of why,电子版 | ||
| 邓力、刘洋 | 【2018-11-9】Deep Learning in Natural Language Processing | ||
| Artificial Intelligence: A Modern Approach | |||
| Convex Optimization | |||
| Deep Learning Fundamentals: An Introduction for Beginners | |||
| Optimization in Operations Research | |||
| Artificial Intelligence: A Modern Approach | 参考AI算法8本书 | ||
| 复旦邱锡鹏教授 | 【2019-04-09】神经网络与深度学习-pdf | ||
| 伯克利 | 【2019-04-28】Spring 2019 Full Stack Deep Learning Bootcamp,伯克利-全栈深度学习课程 | 覆盖面很广,很有价值 |
大神博客
- Andrej Karpathy博客,Colah’s Blog,Neural Networks, Manifolds, and Topology,Understanding LSTM Networks,印度人总结的cnn笔记
- 如何简单有趣的讲解神经网络(优质),什么是人工神经网络(数学模拟过程清晰)
- 一文读懂深度学习,深度学习:像人脑一样深层次思考
- Deep Learning(深度学习)学习笔记整理第一部分|第二部分|第三部分|第四部分|第五部分|第六部分|第七部分|第八部分
- 深度学习为何要深?,超智能体gitbook,台大李宏毅:一天搞懂深度学习,CNN原理3D交互演示-MNIST,CMU备份地址 -【2017-8-6】Andrew NG, 优质ppt Machine Learning and AI via brain simulations
- 【TensorFlow】:Gentlest Introduction to Tensorflow-日本人Khor SoonHin,中文翻译版:小白也能懂的TensorFlow介绍上,下;CS 20SI: Tensorflow for Deep Learning Research,TensorBoard使用方法,introduction-to-tensorflow(PPT)
- 【2018-1-5】没有博士学位,照样玩转TensorFlow深度学习
- 作者斯坦福学生Chin Huyen, Yann LeCun连发三弹:人人都懂的深度学习基本原理(附视频),【2019-04-28】Deep Learning Zero to All, Tensorflow教程Youtube视频,Github代码
- 【2019-05-11】香港科技大学教授Sung Kim的pytorch速成课,Github代码,PPT,youtube视频.全面解读PyTorch内部机制
- 上海复旦大学吴立德教授的《深度学习课程》,张俊林:深度学习在搜索推荐领域的应用
- 深度学习,从神经元到深度学习,神经网络与深度学习:英文网址,中文版下载地址
- 【2017-8-1】反向传播神经网络极简入门(含python代码实现)。Colah的Calculus on Computational Graphs: Backpropagation.
- 1974年有个Harvard博士生Paul Werbos首次提出了backprop,不过没人理他。1986年,Rumelhart和Hinton一起重新发现了backprop,并且有效训练了一些浅层网络,一下子开始有了名气。那个时候的backprop从现在看来并不是个很清晰的概念,把梯度和更新一块打包了。(知乎達聞西)。论文:Rumelhart D E, Hinton G E, Williams R J. Learning representations by back-propagating errors[M]. MIT Press, Cambridge, MA, USA, 1988.
- BP算法解释(多图):Principles of training multi-layer neural network using backpropagation。BP算法推导,A Gentle Introduction to Artificial Neural Networks,一文弄懂神经网络中的反向传播法——BackPropagation,如何直观地解释 back propagation 算法?
- 寒小阳:深度学习视频
- 【2017-8-22】非常好的机器学习/深度学习系列教程:Machine Learning is Fun,作者Adam Geitgey,知乎专栏中文翻译(来自混沌巡洋舰),系列:
- 第一章:最简入门指南
- 第二章:用机器学习制作超级马里奥关卡
- 第三章:图像识别,鸟还是飞机?深度学习与卷积网络
- 第四章:用深度学习识别人脸
- 第五章:谷歌翻译背后的黑科技:神经网络和端到端学习,Machine Learning is Fun Part 5: Language Translation with Deep Learning and the Magic of Sequences
- 第六章:如何用深度学习进行语音识别?,Machine Learning is Fun Part 6: How to do Speech Recognition with Deep Learning
- 第七章:未翻译,Machine Learning is Fun Part 7: Abusing Generative Adversarial Networks to Make 8-bit Pixel Art
- 第八章:未翻译,Machine Learning is Fun Part 8: How to Intentionally Trick Neural Networks
- [2017-8-23]MRSA KaiMing HeTutorial: Deep Learning for Objects and Scenes
- [2017-8-23]Machine Learning Mindmap / Cheatsheet,sklearn,Data Science, Classification Analysis Jupyter notebook
- 【2017-10-10】26种神经网络激活函数可视化,Visualising Activation Functions in Neural Networks(可交互)
- 【2017-12-14】Google deepmind 深度学习实践和发展趋势
- 【2018-4-10】Google AI面试题
- 【2018-4-13】Tensorflow中国社区
- 【2018-7-12】为什么神经网络非凸?
- 【2018-8-3】ICML2018教程:深度学习的理论理解《ICML 2018 Tutorial-Toward theoretical understanding of deep learning》
- 【2018-11-12】张俊林,公众号布卡洛林区,文章质量很高,深度学习枕边书,深度学习中的注意力机制
- 【2019-07-08】国立台湾大学机器智能与理解实验室MiuLab,包含对话机器人的各种研究及Github代码,Machince Intelligence & Understanding Laboratory,National Taiwan University
案例及Demo
- 【2019-04-12】知乎专题:AI达到什么程度
- ClarifAI图像视频物体识别
- 【2017-8-31】Toranto Deep Learning Demos,涉及图像分类+图像标注,服务性能有限,响应不及时
- Deeplearn.js
- 你们天天嚷嚷神经网络, 可是知道一开始的赫布律么?
- MIT Scene Recognition Demo
- DeepDream Demo
- 20个令人惊叹的深度学习应用(欢迎补充):Demo+Paper+Code
- [2017-9-20]ClarifAI在线Demo(目标检测、人脸识别、色情识别、场景识别等)
- 【2018-2-25】在线demo:黑白图片着色
- 【2018-5-13】TensorFlow.js浏览器里的实时人体姿态估计,【2019-05-06】tensorflow.js web demo大全-github部署 -【2019-04-11】Tensorflow发布实时任务分隔模型,Demo地址
- 【2018-5-13】Kaggle Kernal免费GPU试用案例
- 【2018-5-26】无需深度学习框架,如何从零开始用Python构建神经网络
- 【2018-8-11】手把手:在Colab里把TPU用起来HowTo Start Using TPUs From GoogleColab in Few Simple Steps
- 【2018-9-11】Tensorflow分布式实现(含简介概要+代码+图示)
- 【2018-9-19】AI,ML标注平台Demo Prodigy
- 【2018-10-4】AI学习曲线,源自算法工程师的危机
- 【2018-12-16】AI领域state-of-art技术汇总,【2019-03-13】各领域效果最佳论文及代码Browse state-of-the-art
- 【2019-03-20】Tensorflow解决ranking问题
CNN
- ImageNet 缔造者:如何让冰冷的机器读懂照片背后的故事?, TED视频,网易公开课
- CS231n Convolutional Neural Networks for Visual Recognition,Youtube视频地址,Andrej Karpathy Youtube主页,CS231n官方笔记授权翻译总集篇发布
NLP自然语言处理&RNN
返回目录- 【2017-8-1】NLP十分钟入门,【2018-7-23】NLP哪里跑: 什么是自然语言处理优质入门文章, 【2018-8-3】追踪NLP最新技术进展的两个好地方 NLP-progress,decaNLP
- 斯坦福CoreNLP在线Demo演示(含分词WS、POS词性标注、NER命名实体识别、语法树等等),斯坦福NLP相关软件, 斯坦福深度学习与自然语言处理课程CS224d: Deep Learning for Natural Language Processing学习笔记(我爱自然语言处理)

- 国内外自然语言处理(NLP)研究组大全
- 【2017-12-22】
。 - Boson NLP波森自然语言处理Web演示

- 【2017-12-21】 深度学习为什么在NLP管用?Deep Learning, NLP, and Representations,深度学习、自然语言处理和表征方法. Deep Learning in NLP (一)词向量和语言模型.如何生成好的词向量?《How to Generate a Good Word Embedding?》导读,,,论文地址,实验代码地址
- 【2018-4-15】机器翻译简史

- 【2018-4-16】谷歌发布的自然语言理解(NLU)体验,Semantic Experiences,Talk to Books + Semantris
- 【2018-4-19】11款分词工具大比拼,jieba分词15min入门与进阶,jieba Github地址
- 【2018-5-13】100+ Chinese Word Vectors 上百种预训练中文词向量
- 【2018-7-21】牛津大学DeepNLP 2017课程Deep Learning for Natural Language Processing: 2016-2017,github,网易云课堂
- What’s next for NLP&AI? 来自Richard的twitter,工具包decanlp

- 【2018-7-27】https://medium.com/@ageitgey/natural-language-processing-is-fun-9a0bff37854e
- 【2018-8-12】刘知远:语义表示学习20180726_语义表示学习_CIPS暑期学校,ppt,知识指导的自然语言处理
- 【2019-04-08】图解word2vec,通俗讲解词嵌入方法的来龙去脉(源自大数据文摘),原文:The Illustrated Word2vec
- 【2019-6-2】免费书籍AutoML-Auto Machine Learning,A Beginner’s Guide to Automated Machine Learning & AI
- 【2019-07-02】清华九歌诗词自动生成系统-含代码
RNN
- 循环神经网络RNN:BiLSTM iMDB影评分类可视化Demo
- 【2018-5-2】可视化LSTM网络:探索「记忆」的形成。【2018-5-8】对LSTM中M(Memory)的再思考,YJango的循环神经网络——实现LSTM
- ImageNet 缔造者:如何让冰冷的机器读懂照片背后的故事?, TED视频,网易公开课
- [2017-8-17]CS224n: Natural Language Processing with Deep Learning
- Neural Nets for Generating Music

- Word2Vec教程:通俗易懂,Part-1,Skip-Gram模型,原文:word2vec tutorial the skip-gram model;Part-2,Negative Sampling,原文

- The amazing power of word vectors
- 【2017-12-29】Embedding Projector.

- 【2017-12-11】CMU,Neural Network for NLP
- 【2017-12-12】NLP牛人
- 斯坦福李纪为
- 李纪为:用于对话生成的深度强化学习
- 让机器像人一样交流:斯坦福李纪为博士毕业论文
- 【2018-1-15】李纪为创立的香侬科技获红杉千万投资,金融搜索分析工具
- 香港理工李嫣然
- 【2018-4-2】Google Brain开发者,蔡善清, Github主页, 2005进入清华,2012年MIT博士毕业, tensorflow debugger主要开发者(以后会集成到tensorboard中),Eager动态计算图开发者
- 【2018-4-27】完全图解RNN、RNN变体、Seq2Seq、Attention机制,将各自的关系讲的清清楚楚。【2018-5-12】神经网络机器翻译模型可视化(注意力Seq2seq模型机制)《Visualizing A Neural Machine Translation Model (Mechanics of Seq2seq Models With Attention)》.
,【2019-04-15】【NLP】Attention Model(注意力模型)学习总结【2018-7-1】图解机器翻译transforms实现,原文The Illustrated Transformer,非常好的讲解资料!Jay Alammar的其它文章:The Illustrated Word2vec,The Illustrated BERT, ELMo, and co. How NLP Cracked Transfer Learning,The Illustrated Transformer
- 斯坦福李纪为
- 【2018-5-1】机器阅读理解google QANet的Tensorflow实现
- 【2018-5-18】解密谷歌 Gmail 新功能:结合 BoW 模型和 RNN-LM,帮助用户快速写邮件
- 【2018-7-23】Keras.js实现的web版情感分析
- 【2018-7-25】Google文本分类,官方解读

- 【2018-7-25】Google AutoML Natural Language 官方体验地址,涉及PoS,NER,情感分析,翻译,tts和asr,相关文章:Empowering businesses and developers to do more with AI。

- 【2018-9-7】谷歌大脑出品:注意力与增广RNN,Attention and Augmented Recurrent Neural Networks,

- 【2018-11-12】张俊林的从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史
语音
- 【2018-5-13】音频样本浏览器,支持音频分析、相似搜索、智能分类等
- 【Google Duplex:通过电话进行自然对话以执行“真实世界”任务】《Google Duplex: An AI System for Accomplishing Real World Tasks Over the Phone | Google AI Blog》
对抗生成学习
VAE和GAN,VAE和GAN- [2017-7-28]AI专家的忏悔Confession of a so-called AI expert
- 【2017-7-30】Google的AI产品:QuickDraw,类似你画我猜,只是用机器来猜。【2019-05-06】如何利用TensorFlow.js部署简单的AI版「你画我猜」
- Facebook AI实验室最新的实时GAN图片展示
- 集智俱乐部李嫣然:《深入浅出GAN-原理与应用》学习笔记,厉害了,我的GAN
- 【2018-9-11】GAN工作原理演示Demo, GAN Lab详解
- 【2019-05-17】GAN 毕业手册:从零到一构建自己的 GAN 模型,用 MNIST 数据集训练网络,用 Comet.ml 对实验数据和参数进行分析,并生成手写数字
强化学习
返回目录- 强化学习、监督学习和无监督学习对比:

- 一文了解强化学习
- 【2017-7-31】David Silver 强化学习公开课中文讲解
- 【2017-8-21】Q-learning算法简明教程,英文原文
- 【2017-8-29】AK的博客Deep Reinforcement Learning: Pong from Pixels
- 【2017-12-19】强化学习领军人物Richard Sutton的经典教材《强化学习》第二版。
- 【2017-12-21】强化学习视频教程分享(从入门到精通)
- 【2017-12-21】【视频】深度强化学习介绍 (John Schulman, OpenAI)
- 【2018-5-1】强化学习用于比特币自动交易
- 【2018-7-1】Hands-On Reinforcement Learning With Python
- 【2018-7-29】深度学习炒股,含github代码
- 【2018-11-11】OpenAI深度强化学习课程教程
- 【2018-11-27】UCL Reinforecement learning 视频地址
- 【2019-1-15】A Free course in Deep Reinforcement Learning from beginner to expert.
迁移学习
- 【2017-9-3】中科院计算所迁移学习pdf
- 【2017-9-3】集智俱乐部,迁移学习资料汇总github知乎
- 【2018-5-1】【主动学习:优化!=改进】《Active Learning: Optimization != Improvement》 by LightTag。注:主动学习是指监督学习中,用较少的训练样本来获得性能较好的分类器

- 【2018-5-12】【无需博士学位的TensorFlow深度强化学习教程】《TensorFlow and deep reinforcement learning, without a PhD (Google I/O ‘18) - YouTube》by Martin Gorner. Youtube地址, Bilibili地址
- 【2018-8-16】《Transfer Learning in NLP | Feedly Blog》by Peter Martigny迁移学习在NLP中的应用
- 【2019-04-18】Multi-Task Learning代码示例
知识图谱
- 精益知识图谱方法论,文因互联鲍捷组件的北京知识图谱学习班,知识管理和语义搜索的哲学思考,更多资料参考将门创业历届活动嘉宾视频及ppt, 八一八聊天机器人,聊天机器人终极设计指南,一文看懂聊天机器人的所有猫腻,【2018-5-8】自己动手做聊天机器人,【2019-07-04】零基础系列教程-如何开发微信聊天机器人并集成深度人工智能应用
- 【2017-12-22】李文哲知识图谱的应用

- 【2018-4-9】十分钟上手图数据库
- 【2018-4-17】狗尾草CTO王昊奋When KB meets Chatbots,知识图谱Zhishi.me,开放的知识图谱社区OpenKG.cn
- 【2019-03-09】前员工揭内幕: 10年了,为何谷歌还搞不定知识图谱?
数据挖掘
返回目录- 谁说菜鸟不会数据分析【脑图笔记】
- SQL必知必会【脑图笔记】
- SQL各种join区别:

- 经验总结:以什么姿势进入DataMining会少走弯路?
- 大嘴巴漫谈数据挖掘(易向军),图解各种基础知识和算法概念——五星推荐
- 分分钟带你杀入Kaggle Top 1%,Kaggle求生:亚马逊热带雨林篇
- [2017-8-30]Kaggle 首战拿银总结 | 入门指导 (长文、干货)
- 【2017-12-13】知乎如何快速成为分析师,图表建议-思维指南

- 【2017-12-14】知乎数据分析&数据挖掘书籍推荐
- 【2018-5-2】你费那么大劲做的数据分析,有用吗,左耳朵耗子-陈皓的数据的游戏:冰与火,博主的视频简介,二叉树视频
人脸识别
- 权威书籍Handbook of Face Recognition
- Modern Face Recognition with Deep Learning

- Face Point

- Face Compare

- [2017-9-20]CMU OpenPose姿势识别

- [2017-9-21]自拍照三维重建3D Face Reconstruction from a Single Image
:no_upscale()/cdn.vox-cdn.com/uploads/chorus_image/image/56734861/3d_mark_take_2.0.gif)
- 【2018-2-25】人脸识别:含年龄性别表情人种
- 【2018-7-15】人脸识别入门大全faceai:含情绪、性别识别,表情替换等

- 【2018-7-15】基于tensorflow的实时目标检测

- 2018中国AI战事全景图

IT资讯
返回目录- 查公司信息:天眼查,IT桔子
- 互联网黑名单
- 股权信息:股权周刊(各种股权纠纷案例,作者邓永权)。【干货】创业公司融资时如何分配股权?融资后一般怎么稀释?
- 程序员跳槽全攻略-读书笔记

- 【2018-1-7】程序员职业生涯蓝图。

- Gartner:技术成熟度曲线.Gartner2016 年度新兴技术成熟度曲线解读:3 大趋势、16 个新技术

- 互联网大佬的出生地图鉴
- SixSence,The thrilling potential of SixthSense technology,Pranav Mistry

- IT橘子人工智能全产业链图谱
- 【2018-1-8】36Kr,互联网中的少数派-女性开发者(视频),全世界1850w程序员,中国占10%,主人翁司晓静、刘旸(iOS开发,天气旋律闹钟weather tunes)、创业公司castbox CEO王小雨(北大心理学系自学转Android开发,fruit boom杰作,Google)。
- 【2018-1-16】舒适区、恐慌区,参考知乎不断跳出自己的「心理舒适区」真的能够让人们取得更大的成就吗?
如何成为一个很厉害的人?

- 【2018-11-24】邓宁-克鲁格心理效应,又称达克效应

- 【2018-5-2】技术人员的发展之路
- 【2018-9-28】阿里技术参考图册算法篇,研发篇
- 【2018-2-25】纪实:中国人工智能之路,人工智能真的来了
- 【2019-06-03】人类唯一的出路:变成人工智能系列, 全部看完会开心很久,精品原文:waitbutwhy出品,Neuralink and the Brain’s Magical Future
- 【2018-4-25】阿布量化
- 【2018-8-9】How Google works? pdf下载,知乎评价,英文版
- 【2019-03-11】互联网一些事儿,包含最新各行业调查报告
工具
返回目录- 视频下载工具:流媒体下载的10种方法
- 硕鼠(可以下载流视频,可按专辑下载),硕鼠Mac版下载地址(官网地址有问题)
- 维棠
- YouTube视频下载:(更多方法参考知乎帖子:如何下载youtube视频)
- (1)每个视频域名稍作修改即可(youtube.com->kissyoutube.com),SaveMedia提供,在线下载+系列视频自动推荐
- (2) python代码下载,pip3 install you-get,you-get ‘https://www.youtube.com/watch?v=jNQXAC9IVRw’, 支持的视频网站范围广. 【2018-9-20】视频下载工具annie,覆盖几乎所有视频网站
- (3) clipconverter
- 【2019-04-24】安装annie,可批量下载,windows下:scoop install annie,步骤:Set-ExecutionPolicy RemoteSigned -scope CurrentUser; iex (new-object net.webclient).downloadstring(‘https://get.scoop.sh’)
- 【2018-6-21】webrtc peer to peer文件传输工具, 基于浏览器,直接选中本地文件,生成下载链接,速度400kb,示例:mathematica下载,【2019-05-16】mathematica快速入门
- 【2019-06-08】突破百度网盘限速工具Pandownload
- 【2018-12-9】录屏制作成gif工具GifCam,在线OCR工具,如提取图片里的excel表格,【2018-12-16】在线LaTeX编辑器overleaf,数学公式截图转LaTeX,

- lantern下载,蓝灯无限制版
- 在线代码着色(高亮):国外:含语言类型自动识别(优),国内:在线代码着色器(需要自己勾选),实时英文拼写检测,插件下载地址,【2018-10-11】pycorrector - 中文错别字纠正工具。音似、形似错字(或变体字)纠正,可用于中文拼音、笔画输入法的错误纠正,Demo地址,
sudo pip install jieba kenlm pypinyin pycorrector - 【2019-07-18】编辑器学习曲线:
- 如何使用VIM搭建IDE?,vim键盘图大全,所见即所得,像IDE一样使用vim,


- 台湾人总结的vim命令图解(pdf打印版)
- 【2017-12-14】awk思维导图,sed思维导图,更多linux工具总结
- python下的二维码生成与解析,【2019-04-29】二维码识别原理

- 【2018-9-9】哪些相见恨晚的python库
- 【2018-2-17】用PYTHON玩微信(非常详细),通过微信网页版抓包的开源工具itchat,可以分析微信数据,可视化(echart+wordcount),聊天机器人,接入图灵机器人,示例,【2018-7-15】接入微软小冰,把公众号升级为人工智能公众号的攻略,支持文章回复,其它:Python实现微信自动回复机器人,python实现微信接口(itchat)资料全面
- 【2018-4-4】微信小程序开发,官方小程序简易教程,微信小程序开发资源汇总
- 【2017-12-17】如何用github搭建个人博客,【2018-2-19】微信公众号如何接入图灵机器人,【2019-02-23】中文语音对话-悟空机器人wukong-robot
- 【2018-2-16】1997年世界黑客编程大赛冠军作品,视频地址,汇编语言生成3D动画
- 【2018-3-31】文件转换,①pdf转换器,②迅捷pdf转换器,pdf到各种文件格式的转换,③国外的pdf converter
- 【2018-4-2】Heavens Above, 查看天体运行,如特斯拉实时位置,天宫一号降落过程
- 【2018-5-1】《后端架构师技术图谱》
- 【2018-8-9】正向代理+反向代理总结

- 【2018-5-20】Linux,一生只为寻找欢笑知乎帖子,Linus Torvalds名言:Talk is cheap,show me the code!翻译:①正经版:代码胜于雄辩②俗版:屁话少说,放码过来③文艺版:纸上得来终觉浅,觉知此事需躬行④红色版:空谈误国,实干兴⑤邦隐晦版:北沙滩,亮马桥
- 【2018-12-6】漫画图解linux内核,

- 【2018-5-22】基于HTML5超酷摄像头(HTML5 webcam)拍照功能实现代码,基于WebRTC技术
- 【2018-7-28】世界最大外文电子书搜索引擎B-OK, 鸠摩电子书搜索引擎
,【2018-8-7】虫部落快搜搜索大全 - 【2018-10-9】抓包工具:青花瓷charles官网,在线破解. fidder
- 【2018-10-11】一图读懂开源license,

- 【2018-11-3】IP地址详解
- 【2018-11-20】图解浏览器工作原理
- [2017-9-19]视频集合:内存原理解析,CPU缓存原理解析,TCP,UDP协议原理对比,IPv4,IPv6原理解析,代理服务器原理解析,集线器-交换机-路由器区别,DNS域名解析,超线程原理解析,磁盘碎片原理解析
- 【2018-3-13】松果云科普:动画解释,详解硬盘工作原理,详解显卡工作原理:GPU和CPU的区别
- 【2019-03-22】HTTP协议详解,【2019-04-11】细说API,重新认识RESTful
- 【2019-05-27】电视直播链接汇总
- 【2019-05-28】网站用户可视化组件,代码如下:
实验评估
- 第一种:A/B-Test. 什么是ab-test?
- A/B Test,也称为对比测试,是让两个版本的登陆页面的相互pk测试。看看哪个版本能更好地引导访问者达到你的预设目标,如注册或订阅。
- 工程实施:叫你如何对产品进行AB Test?,包含服务端、客户端如何实施ab-test,及各自的优缺点
- ab-test有什么局限性?
- 首先,A/B测试只有在关键效绩指标(KPI, or Key Performance Indicator)单一,且这个单一明确的目标可以被电脑量化时,适用
- 其次,A/B测试相比起一些别的测试手段,如纸本原型(paper prototyping),需要的工作量大、时间长,对设计的要求也相对较高。
- 另外,A/B测试之所以进行,唯一原因是对结果的追求。但相对应的测试结果通常是短期、即刻的用户行为,比如购买、注册、点击等。
- 此外,A/B测试并不能提供用户行为的具体细节。A/B测试的结果也仅限于被测试的两个选项:如果12号字比16号字为你的网站带来多1%的用户浏览时间,那10号字呢?8号呢?A/B测试并不能帮助你作更多的、长远的决定。
- A/B测试还有别的缺点:需要的用户人数大,可能的影响因素多,可以测试的选项数有很大限制等等。
- 吆喝科技-ab-test最佳实践
- 第二种:interleaving,参考美团分享的文章沈国阳:美团推荐系统整体框架与关键工作.
- abtest的好处是可以对多个策略给出定量评估,坏处是:①策略差异小时,评估结果波动大②需要较长时间反馈,导致迭代速度慢
- 改进:interleaving,所需流量小,灵敏度高(24h内),但只能给出定性结论。基本思想是将两个策略混合,对所有用户统计分析判断哪个好
- 【2018-6-22】优质资源,多图解释Innovating Faster on Personalization Algorithms at Netflix Using Interleaving
- 灰度发布和A/B Test
编程语言
返回目录- 命令式编程和声明式编程的区别
- go语言开发者必读的陷阱、技巧、错误
-
【2018-5-2】Python入门神图,参考:Python脚本图解,Python入门思维导图百度云盘下载
-
python:python小白笔记,python正则表达式,【2019-03-31】正则表达式在线调试Regulex
- 【2018-5-4】Python代码执行过程可视化
- 【2017-12-11】python面向对象:初级篇,进阶篇
- 【2018-4-28】Dive into Python中文版
- 【2018-6-4】图解深拷贝和浅拷贝
- 【2018-5-30】request发明人的python教程:The Hitchhiker’s Guide to Python!,Python大神,requests库的作者放大招了
- 【2018-6-28】python函数到底是传参还是传引用?
- 【2018-5-6】Machine Learning Plus,包含numpy、pandas、scikit-learn各种工具包的代码实战示例,用python做科学计算-Numpy快速数据处理
-
- The Zen of Python(Python之禅)
-
-
Python 之禅, by Tim Peters
- 优美胜于丑陋(Python 以编写优美的代码为目标)
- 明了胜于晦涩(优美的代码应当是明了的,命名规范,风格相似)
- 简洁胜于复杂(优美的代码应当是简洁的,不要有复杂的内部实现)
- 复杂胜于凌乱(如果复杂不可避免,那代码间也不能有难懂的关系,要保持接口简洁)
- 扁平胜于嵌套(优美的代码应当是扁平的,不能有太多的嵌套)
- 间隔胜于紧凑(优美的代码有适当的间隔,不要奢望一行代码解决问题)
- 可读性很重要(优美的代码是可读的)
- 即便假借特例的实用性之名,也不可违背这些规则(这些规则至高无上)
- 不要包容所有错误,除非你确定需要这样做(精准地捕获异常,不写except:pass风格的代码)
- 当存在多种可能,不要尝试去猜测
- 而是尽量找一种,最好是唯一一种明显的解决方案(如果不确定,就用穷举法)
- 虽然这并不容易,因为你不是 Python 之父(这里的 Dutch 是指 Guido)
- 做也许好过不做,但不假思索就动手还不如不做(动手之前要细思量)
- 如果你无法向人描述你的方案,那肯定不是一个好方案;反之亦然(方案测评标准)
- 命名空间是一种绝妙的理念,我们应当多加利用(倡导与号召)
-
【2017-11-23】python编码规范,目前有google和pep8两种,pylint默认pep8,Google python编码规范,如何用pylint规范代码风格
- 安装方法:sudo pip install -U pep8/pylint
- 【2018-7-13】python性能优化的20条建议,【2019-1-11】Python如何正确使用import?,总结import的各种用法及区别,精华
- 给深度学习入门者的Python快速教程 - 基础篇,numpy和Matplotlib篇.Python超简洁教程,含图示,在线调试
- 老外的Matplotlib教程,英文原文_,中文译文,Matplotlib官方艺术馆。【2018-6-26】matplotlib的高级接口seaborn官方图例
-
Pandas学习笔记,十分钟搞定pandas,pandas cheetsheet,
-
pandas读取excel数据示例
[2016-7-30]
- 【2018-5-2】6张python工具包总结图,见python数据分析实用小抄,Top 28 Cheat Sheets for Machine Learning, Data Science, Probability, SQL & Big Data,百度云地址
- 【2018-11-18】1000个python库大全
- 【2018-6-6】python最强思维导图合集,来自数林觅风的github
- 【2018-6-10】【精】数据科学知识图谱,数林觅风,精美的脑图笔记
- 【2019-04-10】Python存在的问题:GitHub中文地址,GitHub英文地址
- 【2017-11-23】史上最全设计模式导学目录
- 【2017-12-14】字符编码详解——彻底理解掌握编码知识,“乱码”不复存在,字符字节和编码
- 【2017-12-16】编码总结
-
-
- 【2017-12-23】[译]27 个Jupyter Notebook的小提示与技巧
- 【2018-5-2】scikit-learncheet sheet
- 【2018-5-7】精华:流畅的Python:阅读笔记
- 【2019-03-27】996-ICU,【2019-04-12】程序猿找工作黑名单, 图领奖获得者名单
- 【2019-04-26】Github Page自制个人简历
- 【2019-06-02】一段国产芯片和操作系统往事,中国操作系统往事
- 【2019-06-03】有哪些业余挣钱的途径?
视频资源
返回目录公开课
- 哈佛大学《公正》系列公开课:哈佛英文主页,网易中文翻译
- 自律更自由:康德
- 一张图弄明白:从零维到十维空间,11分钟带你进入十次元的世界(video),GuoKr’s explornation
- 懂了这些之后 才知道如何去赚钱(经济学原理)
- 【2017-8-25】宇宙揭秘:电子双缝干涉实验,绝对颠覆你的三观甚至让你怀疑人生
- 几幅图让你真正了解什么是硕士学位、什么是博士学位
- 一部能让小孩喜欢汉字的动画片。【2018-5-19】国产动画小蝌蚪找妈妈
- 【2017-12-24】一个故事告诉你比特币的原理及运作机制,视频:一个故事告诉你比特币的原理。【2018-1-23】如何简单易懂的介绍区块链,【2018-2-19】区块链讲解及Demo,【2018-3-18】比特币在线Demo:coinDemo,blockchainDemo
- 5G技术:一口气了解5G,【2019-05-25】终于有人讲明白5G了,难怪美国破釜沉舟
- 【2018-10-22】银行与货币系统真相,【2018-11-25】万维财经经济学视频系列,覆盖经济规律、通货膨胀、货币等,通俗易懂,如:经济机器是怎样运行的,【2019-03-07】2008年金融危机的电影大空头
- 【2017-12-31】视频短片:时间(工薪族一家三口的作息时间差),皮克斯2016创意动画《鹬》,【2018-11-25】反映社会的短片:Dinner for few,【2019-03-01】承认吧,人生来就是孤独的,【2019-04-14】90分钟看完《知行合一王阳明》观传奇人生是怎样炼成的!
- 【2018-2-25】【电影】暖,白狗秋千架。【2018—3-17】美丽心灵(博弈论创始人,纳什)+ 万物理论(霍金),【2018-12-16】印度拉马努金传记知无涯者,Will Hunting 心灵捕手【2018-11-25】马云励志演讲:最伟大的成功
- 【2018-3-1】杭州买房知识大全github
- 【2018-9-25】公积金介绍-视频
- 【2018-10-9】BBC纪录片盘点全球N种最不健康饮食方式
- 【2018-10-13】崔永元-我的抗战
- 【2019-03-28】996公司名单
- 【2019-04-05】扒手表演


