值得一看的Precog大数据平台

发布于:2021-02-13 00:00:34

0

134

0

Precog 大数据 Apache Hadoop

我们与最新的大数据项目集背后的人进行了交谈,以简化从数据中获取分析的整个过程。

在过去的几年中,数据格局发生了根本性的变化,这部分不归功于Hadoop的成功。Apache项目已成为数据仓库的金标准,并且使用它的大量客户证明了它的成熟性和稳定性。 

这么多企业都在宣传Hadoop的功能,因此当您实际上正在寻找完全不同的东西时(无论是图形数据库,NoSQL数据存储还是其他),就很容易被它的明星能力所吸引。如果您选择使用Hadoop,那么如果您尝试将其变成并非如此,那么您可能会陷入麻烦。

在过去的一年中,我们看到了许多“大数据”风格的项目出现,但是从来没有像 Precog这样的项目能够简化整个过程。大数据基础架构平台于上个月进入公众测试阶段,广受赞誉,其目标是弥合可供公司使用的一系列数据资产之间的差距。

“我认为Precog是一个数据科学平台,可以帮助公司利用其数据资产来构建新的数据项目以及现有产品的数据驱动功能,” Precog的创始人兼首席执行官兼CTO John De Goes说。他继续说:“如果您想考虑其他技术,Precog是一种数据库,但它专注于非常特定的用例。”

该用例是测量数据和数据科学领域。从成为社交媒体广告平台SocialMedia.com的工程副总裁开始,De Goes就厌倦了依靠低级开源工具构建分析功能的“艰巨任务”,并决定为此做些事情。带着开发人员杂乱无章的团队一起去 丹佛创业周末,播种了Precog的种子。从那以后,该公司于去年5月被加入加速器TechStars计划,使他们能够进一步追求自己的想法。

“ Precog与(与其他数据库)完全不同,因为我们专注于存储和仓储测量数据,” De Goes说。“这通常是行为数据,例如人们点击和购买东西,因此是交易数据,历史数据和面向事件的数据。这就是我们关注的数据。”

“我们不专注于为您提供获取和存储数据的工具,我们专注于为您提供深度数据科学工具,以在非常深的层次上分析数据,并在该数据中心内进行任意分析,统计和机器学习。 ”

因此,从本质上讲,Precog并非企业学习Hadoop(其中有很多)或非关系数据库(如MongoDB)的来龙去脉的繁琐过程,而是为企业提供了重要的帮助,以获取重要的见解,然后对它们的数据进行“生产”努力。

Precog的 “实时Twitter选举分析” 仪表板展示了Precog融合各种来源的能力的一个很好的例子。与合作伙伴AlchemyAPI一起,Precog通过显示推文的逐个州情感分析来展示其平台的功能和潜力。

“说实话,简直太简单了,”德戈斯说。“ [我们]只是将来自Twitter的数据插入到Precog中,[在Labcoat中进行Quirrel分析,将其导出为代码,将其打入HTML文档中,然后就可以对Twitter数据进行实时情绪分析。”

De Goes认为,没有足够的企业看到其数据的真正功能。他说:“我认为,在当今时代,公司在存储和整合他们拥有的海量数据方面变得越来越自在。”

“现在,每个人都有大数据。好吧,那又如何呢?下一步有趣的步骤是弄清楚如何处理大数据。那是真正困难的部分。任何人都可以购买数据仓库或大型Hadoop集群,然后开始在其中存储数据。这就是您从拥有大量数据,到根据这些数据实际赚钱的方式,这是下一个合乎逻辑的步骤。”

{xunruicms_img_title}

从他们的私人Beta版开始,Precog似乎已经考虑了所有途径。通过其支持JSON的 REST API集 (帐户,接收,元数据,分析和安全性),用户可以设置工作来创建自己的解决方案,或向现有服务中添加内容。.NET,Ruby,Python,PHP,JavaScript和Java(当然还有Java)中的客户端库已经包含了核心编程语言,De Goes表示,他们想要定位的对象占90%。另外两个产品在Precog平台中扮演着重要的角色–为我们中的数据科学家设计的Labcoat IDE和用于可视化您所使用的所有数据的ReportGrid。在最近的Gigaom文章中,

有人引用De Goes的话说:“哈多普很愚蠢”。不是技术本身,而是某些人将其作为解决“天真”问题的想法。

“我显然不认为Hadoop技术是愚蠢的,” De Goes解释说。“不幸的是,企业和大公司使用Hadoop作为解决其所有数据问题的灵丹妙药的方式。这种心态非常愚蠢,其原因是在大数据世界中,这全都是妥协。当您能够存储TB或PB的数据时,您将不得不做出某些让步–您将在某些方面妥协。您选择的特定技术正是您要妥协的条件。”

“这里有很多错误信息,许多供应商都在试图把Hadoop压倒在人们的喉咙上,或者说是他们为Hadoop束手无策的创可贴。我的想法是使用正确的工具完成正确的工作。”

这是一个简单的概念,但在这个世界上,没有一个人被钱财所了解。Precog本身会成为这种思维转变的驱动力吗?如果本周的迹象过去了,那很有可能。就在昨天, 该公司宣布实施MongoDB,允许用户在其MongoDB数据库之上运行更深入的分析,而无需做出任何妥协(自定义代码或额外的ETL)。

随着Precog走向适当的发布,与数据源背后的公司的这些联系和伙伴关系对于打破大数据的复杂性至关重要。从外观上看,他们正朝着正确的方向前进,并可能会领导下一代大数据应用程序开发。