-
科学专业是否会“被自动化”?
所属栏目:[大数据] 日期:2021-05-22 热度:186
前几天,我读了一篇关于Uber希望如何赋予其每位员工数据科学力量的文章。以下引文特别引人注意: 预测平台的宏伟愿景是只需按一下按钮即可提供预测,完全不需要预测专家。用户唯一需要的输入是历史数据,无论是CSV文件还是查询链接的形式,以及预测范围。您[详细]
-
无需依赖英语数据,100种语言互译机器
所属栏目:[大数据] 日期:2021-05-22 热度:182
机器翻译(MT)能够打破语言障碍,将不同语种的人团结起来,为不同人群提供有关COVID的权威信息以帮助他们避免感染。得益于我们在低资源机器翻译及翻译质量评估的最新研究与进展,现在,我们每天能够在Facebook News Feed上提供近200亿次翻译。 典型的MT系统[详细]
-
“死磕”底层数据技术
所属栏目:[大数据] 日期:2021-05-22 热度:105
什么是大数据?《大数据时代》的作者舍恩伯格认为,大数据并不能定义个确切的概念。大数据是人们获得新的认知,创造新的价值的源泉,大数据是改变市[详细]
-
知识图谱改变银行业务模式?
所属栏目:[大数据] 日期:2021-05-22 热度:186
简介 本体或知识图谱可不是随拿随用的,使用者需要做出相应的努力才能发挥其作用,使其成为有效可用的工具。我们知道,领域知识的用处极大,然而这些知识却总是不完备的,将领域知识表示为图中的数据可不容易。在这个过程中,关键在于将你掌握的领域知识完美[详细]
-
轻松进行自监督学习
所属栏目:[大数据] 日期:2021-05-22 热度:174
在深度学习中,经常遇到的问题是没有足够的标记数据,而手工标记数据耗费大量时间且人工成本高昂。基于此,自我监督学习成为深度学习的研究热点,旨在从未标记样本中进行学习,以缓解数据标注困难的问题。子监督学习的目标很简单,即训练一个模型使得相似的[详细]
-
帮你拓展思维的39个网站
所属栏目:[大数据] 日期:2021-05-22 热度:125
即使你每天投入短短十分钟内到这些优质资源中,你的事业和个人生活就会变得不一样。 网络成为一个越来越强大的资源,可以轻松地帮助你学到新的东西。你有很大的机会能够把这些网站中的至少一个好好利用起来,成为更好的自己。 我每周都会持续访问其中的一些[详细]
-
27个深度强化学习算法的实例项目
所属栏目:[大数据] 日期:2021-05-22 热度:139
在这里,您可以找到几个致力于深度强化学习方法的项目。 项目以矩阵形式部署:[env x model],其中env是要解决的环境,而model是解决该环境的模型/算法。 在某些情况下,可以通过几种算法来解决同一环境。 所有项目均以包含培训日志的Jupyter笔记本的形式呈[详细]
-
4 个最值得推荐的 VS Code 插件
所属栏目:[大数据] 日期:2021-05-22 热度:188
TabNine基于OpenAI的GPT-2,在200万个Github文件上进行训练。由于GitHub,TabNine熟悉一系列任务、算法、编码风格和语言。TabNine可以缩短编码时间,尤其是在输入死板的函数时。随着你的使用,你会惊讶地发现,你的TabNine正变得越来越聪明。 我们有理由相信[详细]
-
AlphaZero强化学习算法解读
所属栏目:[大数据] 日期:2021-05-22 热度:56
尽管这一里程碑事件意义非凡,但人们仍可以争论这一计算机系统是否智能。 这一类计算机系统由以下三个组件构成: 1. 人为定义的评价函数; 2. 博弈树搜索算法; 3. 极为强悍的硬件设备。 评价函数会将棋盘盘面作为输入并输出该盘面的价值。高价值表示当前玩[详细]
-
AI专家们推荐的“必读”论文
所属栏目:[大数据] 日期:2021-05-22 热度:107
推荐人:MILA博士研究员,Alexia Jolicoeur-Martineau 推荐论文1:f-GAN: Training Generative Neural Samplers using Variational Divergence Minimization (f-GAN: 使用变分散度最小化训练生成神经采样器)- Sebastian Nowozin et al. Alexia提出可以将若[详细]
-
NLP技术预算增长高达30%
所属栏目:[大数据] 日期:2021-05-22 热度:145
2020年对于公共卫生、职业生活、经济以及日常生活的几乎所有其他方面来说,都是独一无二的一年。虽然一些机会正在消失,另一些则正在转变其商业模式,罕见没有受到冲击的企业。尽管如此,还是有一些行业正在蓬勃发展,不仅仅是虚拟会议或医疗保[详细]
-
本体和知识图谱之间的区别
所属栏目:[大数据] 日期:2021-05-22 热度:55
随着语义应用程序成为业界越来越热门的话题,客户经常来EK询问有关本体和知识图谱的问题。具体来说,他们想知道两者之间的区别。本体和知识图谱是一回事吗?它们有何不同?两者之间是什么关系? 在这篇博客中,我将引导您了解本体和知识知识图谱,讲述它们之[详细]
-
2020挑战中学到了什么
所属栏目:[大数据] 日期:2021-05-22 热度:107
ecommender系统是现代社交网络和电子商务平台的重要组成部分。它们旨在最大限度地提高用户满意度以及其他重要的商业目标。与此同时,在以根据用户兴趣定制内容为目的来建立新模型基准测试时,缺乏供学界研究使用的大规模的公共社交网络数据集。而在过去的一[详细]
-
我该系统地看哪些书和课程?
所属栏目:[大数据] 日期:2021-05-22 热度:122
自2013年以来,我一直在研究自然语言处理(NLP),当时手动特征工程在机器学习领域非常流行。从那时起,我们已经走了很长一段路。我实际上是为我的博士专门研究信息检索和机器学习技术的,尤其是它们如何应用于社交计算和计算语言学,同时还开发了从大规模基[详细]
-
正为神秘Fuchsia OS招募外部开发者
所属栏目:[大数据] 日期:2021-05-22 热度:115
近期,谷歌公司对外发布的一个公告,显示着其仍在持续开发这个新的操作系统。公告显示,谷歌将从公司外部寻求更多的开发者,以便于让该操作系统变得更加开放。 谷歌方面表示,其已经为该项目的讨论创建了新的公共邮件列表,添加了一个专门阐述如何制定战略决[详细]
-
改变游戏规则的十个突破性观点
所属栏目:[大数据] 日期:2021-05-22 热度:90
简洁明了,不是吗? 这个看起来简单的算法在现实世界中可以应用在很多场景,例如-优化,递归神经网络的训练过程,某些问题解决任务的平行化,图像处理之类的。 尽管有这么多的可行方向,基因算法目前还没有任何实际成果。 3.自我编辑程序 -需要小心的程序员[详细]
-
最适合学习英语的Netflix电影和电视剧有哪些?
所属栏目:[大数据] 日期:2021-05-22 热度:200
截至2020年,Netflix上约有3712部电影和1845部电视节目。如果你正在学习英语,可供选择的内容很多,但你可能没那么多时间去看完。因此,我用数据科学技能来分析Netflix上前1500部电影和电视节目的剧本。经过大量的处理,我找到了Netflix上最好的英语学习内容[详细]
-
KODA开启人机交流的新篇章
所属栏目:[大数据] 日期:2021-05-22 热度:71
2016年春天,AlphaGo与世界顶级围棋高手的人机对决,将人工智能呈现在世界舞台的聚光灯下。短短四年时间,人工智能技术发展迅猛,已经对世界经济、人类生活和社会进步产生极其深刻的影响。不得不承认,人类正在进入智能化时代。 在未来,人工智能将会如何影[详细]
-
NLP和计算机视觉的30个顶级Python库
所属栏目:[大数据] 日期:2021-05-22 热度:177
那么事不宜迟 ,下面就是由KDnuggets员工精心挑选的30个可用于深度学习,自然语言处理和计算机视觉顶级Python库。 深度学习 1. TensorFlow 星标:149000,提交数:97741,贡献者:754 TensorFlow是针对机器学习的端对端开源平台。它具备综合灵活的工具、库和[详细]
-
快试试这个Kaggle大数据集高效访问教程
所属栏目:[大数据] 日期:2021-05-22 热度:187
我敢肯定,你在解决某些问题时,一定报怨过没有足够的数据,但偶尔也会抱怨数据量太多难以处理。本文探讨的问题就是对超大规模数据集的处理。 在数据过多的情况下,最常见的解决方案是根据RAM采样适量数据,但这却浪费了未使用的数据,甚至可能导致信息缺失[详细]
-
重温强化学习之父Sutton关于AI的70年惨痛教训
所属栏目:[大数据] 日期:2021-05-22 热度:148
就在不久前的过去,在一个与我们今天相差无几的世界上,在达特茅斯学院,有这样一个雄心勃勃的项目,志在弥合人类与机器智能之间的鸿沟。那是1956年。虽然达特茅斯夏季人工智能研究项目并不是第一个对思考机器的潜力提出设想的研究项目,但它的确为这个领域[详细]
-
当机器学习从生物学中汲取灵感时
所属栏目:[大数据] 日期:2021-05-22 热度:58
生物学知识也可以成为机器学习中灵感的来源。 内容 本文重点关注的一个例子是进化决策树。 这类分类器使用进化算法来构建鲁棒性更强,性能更好的决策树。进化算法依赖于生物进化启发的机制。 决策树是什么? 如何根据进化算法搭建决策树? 与其它分类器相比[详细]
-
因果推理“三问”:是什么?
所属栏目:[大数据] 日期:2021-05-22 热度:144
在上图中,我举了一个混淆变量,其中年龄与戒烟率和致死率都是正相关的。年龄越大,死亡率越高,但吸烟率越低。如果我们在估计吸烟对死亡率的影响时没有控制年龄,我们可能会观察到吸烟会减少死亡率这样荒谬结果。我们不能在这里得出因果关系,因为我们没有[详细]
-
大数据背景下的最佳异常检测算法
所属栏目:[大数据] 日期:2021-05-22 热度:90
算法要点/总结 我通过下面的综述来非常简洁地总结原来有10页内容的论文: 大多数其他异常检测(OD)算法尝试去建立正常数据的范围,从而把不属于这个正常范畴的个体标注为不正常。iForest则直接通过利用异常点的隐含特质来把他们分隔开:他们在协变量集上会拥[详细]
-
跟着吴恩达老师学习机器学习
所属栏目:[大数据] 日期:2021-05-22 热度:134
我们开始吧! 线性回归 最简单的机器学习算法。此算法是基于一个高中讲的很基本的直线公式: Y = AX + B 没忘吧?忘了也无所谓。这是一个很简单的公式。这是解释为什么这个简单公式可以被用来做预测的完整文章。 纯手撸python线性回归算法:逐步版 上面这篇文[详细]
