该内容源订阅人数为0或长时间未更新图文消息,暂停更新,订阅后可重新开始更新。

给老朋友们推荐几个大数据和机器学习方面的公众号

日期:2017-01-21 10:07:48

这可能是大数据和机器学习业界和学界最强的公众号组合了~~

携程BI团队实践:推荐系统中基于深度学习的混合协同过滤模型

日期:2017-01-20 16:29:10

随着深度学习技术的发展,我们相信深度学习将会成为推荐系统领域中一项非常重要的技术手段。

机器学习2016重大进展全盘点:超级计算成为主流,深度学习框架领域充满活力

日期:2017-01-19 20:54:59

本文分三个部分盘点了2016年的机器学习和深度学习的状态:五大重要趋势;开源机器学习项目的重大进展;业界领先的大型科技公司在机器学习和深度学习领域的举措。

创始人复盘:为什么TiDB会再上HackerNews首页top10

日期:2017-01-18 15:40:39

最近 TiDB 又一次被国际友人顶上了 HackerNews 首页前十。作为一个中国的数据库开源项目,这个趋势很让我们自豪。InfoQ趁机对PingCAP黄东旭进行约稿,复盘TiDB并回顾2016年的几个很重要的设计决定和17年想要做的方向

金融大数据在平安科技信用风险管理中的应用实践

日期:2017-01-17 15:08:48

“美国上百年的金融史,风风雨雨的经济周期走过来,整个体系都很稳健和成熟,中国的整个信用风险市场,因为没有经历过大萧条和崩盘,整体来说还处于一个不成熟的阶段。”

漫谈芒果TV数据平台构建

日期:2017-01-16 15:07:45

本文是1月12日大数据杂谈群分享的内容。本文分享了芒果TV数据团队在基础平台建设、数据管理、数据质量三个方面的一些经验。

美团Apache Kylin精确去重指标优化历程

日期:2017-01-13 11:27:55

精确去重指标已经在美团点评生产环境大规模使用,通过4个优化措施,后端仅通过100多行的代码改动,对Kylin超高基数的精确去重指标查询有了明显提升,测试中最明显的查询有50倍左右的提升。

Apache Beam成功孵化为Apache顶级项目:将统一大数据平台的开发

日期:2017-01-12 18:03:44

Google的野心是为世界提供一个易于使用、但是很强大的数据并行处理模型,支持流处理和批处理,兼容多个运行平台。

如何在实战路上与时俱进:深度学习最佳实践

日期:2017-01-11 15:35:01

五个环节万字修行捷径:深度学习促使人工智能在图像、语音、自然语言处理等领域有了实质性的突破,达到产业应用标准。然而实践性强,入门门槛高。本文旨在提供一份清晰、简洁的实践说明,以便从事深度学习研究与工程技术人员能够快速掌握深度学习的实际经验。

Google Play如何利用机器学习来个性化推荐App

日期:2017-01-10 15:58:51

Google Play应用商店有220万个App,超越了苹果的应用商店的200万个App,Windows和Amazon的应用商店则被这两家远远甩在身后。在这浩烟如海的应用商店来发现你中意的App,是怎么做到的呢?

Apache Kylin在唯品会大数据的应用

日期:2017-01-09 12:19:34

目前我们累计有20+个CUBE,10+T存储,最大CUBE记录数上千亿,覆盖了23%的查询。同时,Ad-hoc的响应速度也令人满意。Kylin的平均响应速度是Presto的10.5倍,中位数响应速度是Presto的4.5倍。

比起传统单机数据库, 怎样看待分布式数据库优势与前景?

日期:2017-01-08 17:23:01

本文为阿里巴巴中间件团队高级技术专家励强和 PingCAP CTO 黄东旭两位嘉宾在InfoQ大咖说直播中的内容回顾。

大数据中的反欺诈,平台与羊毛党的攻防恶战

日期:2017-01-06 12:21:41

有句古话,\x26quot;有人的地方就有江湖,是江湖就会有争斗\x26quot;。对于互联网金融平台来说,有实惠的活动中必定有这样一群人出现,大家戏称他们为“羊毛党”。\x0a\x0a随着薅羊毛技术的迭代更新,大数据技术也在发展,一场攻防恶战正悄无声息的进行着。

PingCAP CTO、阿里巴巴高级技术专家邀你共话分布式数据库的那些事儿丨今晚直播

日期:2017-01-05 15:02:01

1 、2016 年数据库圈盘点\x0a2、当数据库遇上分布式\x0a3、数据库发展之\x26quot;刨根问底\x26quot;\x0a4、数据库技术之“斤斤计较”\x0a5、数据库之展望未来

开源“Chaperone”:Uber是如何对Kafka进行端到端审计的

日期:2017-01-04 16:53:21

你使用Kafka时遇到下面的问题会如何解决:\x0a1,是否有数据丢失?如果是,那么丢失了多少数据?它们是在数据管道的哪个地方丢失的?\x0a2,端到端的延迟是多少?如果有消息延迟,是从哪里开始的?\x0a3,是否有数据重复?

百度PaddlePaddle深度学习平台:面向工程师,性能优先

日期:2017-01-03 11:09:35

PaddlePaddle是一个非常务实的平台,这和其他的一些平台不太一样,我们本质是一个面向工程师的平台,是一个已经解决和将要解决一些实际问题的平台,而不是一个专业做科研的平台。百度有超过30个主要产品应用到该平台,比如搜索、杀毒、作业帮。

美国的“大众点评网”Yelp如何利用深度学习对美食照片进行评分

日期:2016-12-30 11:54:44

Yelp的数据库中已经存储了几千万张相片,用户们现在每天都会上传大概十万张,而且速度还在不断加快。文中介绍了Yelp如何用深度学习技术来挖掘每家商户的最好的相片并优先展示在商户封面上,从而为用户提供最好的体验的。

2016年终盘点大数据篇:跨越巅峰,迈向成熟

日期:2016-12-29 10:20:39

大数据技术在2016年继续取得高速的发展,并且在大数据相关的每个细分的环节,都有不同的创新的点。\x0a\x0a2016年底,InfoQ策划了“年终盘点”,希望能够给大家清晰地梳理出技术领域在这一年的发展变化,回顾过去,继续前行。这是其中的“大数据”篇

基于Apache Flink的实时计算引擎Blink在阿里搜索中的应用

日期:2016-12-28 10:02:37

在电子商务网站应用场景中,什么能造就一个强大的搜索引擎?答案就是尽可能的为每个用户提供实时相关和准确的结果。同样一个不容忽视的问题就是阿里巴巴的规模,当前很难找到能够适合我们的技术。

用两个使用Caffe的小项目案例演示迁移学习的实用性

日期:2016-12-27 09:59:19

近年来随着深度学习的急剧升温,不管是学术界还是工业界都把大量资源投入了深度学习。\x0a\x0a最近炒得很火的迁移学习,到底是怎么一回事儿?\x0a\x0a“迁移学习侧重于把解决某一问题时的知识储存起来,以便应用到不同、但是相关的其他问题上去”。

帐号信息

大数据杂谈

微信号: BigdataTina2016

专注大数据和机器学习,每天发布高质量文章,技术案例等原创干货源源不断.大数据社区组建中,在这里与志同道合的朋友分享前沿技术,交流深度思考.我们等你来!