![]() IceskYsl 1.481% disconnected | 登录后回复主题 | 切换简介显示 | 跳到回复(9)![]() Disco is an open-source implementation of the Map-Reduce framework for distributed computing. As the original framework, Disco supports parallel computations over large data sets on unreliable cluster of computers. Disco was started at Nokia Research Center as a lightweight framework for rapid scripting of distributed data processing tasks. Erlang Python ![]() 代码在Githb: http://github.com/tuulos/disco/tree/master
|
3 - 9-8 10:40
404 深圳举一反三:
还有Python的Map/Reduce框架octopy,Python大道至简,就一个文件,即octo.py。
有助记忆:
瑞士名表OCTO(奥克吐)日历手表,始于1848年的OCTO表,名字取自英文八角形 OCTAGON。当年因车厢仪器板内的八日时钟及采用可行八日的长形机芯装嵌成的八角形腕表面世,殿定了OCTO表的独特设计及形象。故此,OCTO由品牌商标以至表形图案都围绕着八角形而设计,尽显特色。
还有Python的Map/Reduce框架octopy,Python大道至简,就一个文件,即octo.py。
有助记忆:
瑞士名表OCTO(奥克吐)日历手表,始于1848年的OCTO表,名字取自英文八角形 OCTAGON。当年因车厢仪器板内的八日时钟及采用可行八日的长形机芯装嵌成的八角形腕表面世,殿定了OCTO表的独特设计及形象。故此,OCTO由品牌商标以至表形图案都围绕着八角形而设计,尽显特色。
5 - 9-10 9:20
bd7lx 深圳http://railspikes.com/2008/9/9/ec2-mapreduce-slides
除了上面的介绍,也有实际的利用EventMachine做MapReduce
并行计算
http://nutrun.com/weblog/eventmachine-mapreduce/
除了上面的介绍,也有实际的利用EventMachine做MapReduce
并行计算
http://nutrun.com/weblog/eventmachine-mapreduce/
8 - 10-4 1:01
404 深圳Greenplum 可以用来进行大规模数据分析,数据并行处理,不单单是MapReduce,而是整合MapReduce+SQL;让程序员玩MapReduce,DBA写SQL,细节交给 Greenplum 的并行数据流引擎处理。

The Power of Parallel Computing for Large-Scale Data Warehousing and Analytics
联想到 Google 的结构化数据的分布存储系统——BigTable。BigTable同时使用了 GFS 和 MapReduce;就连GAE数据默认也是存储到BigTable里。还能联想到MySQL的表分区,拆表等,可惜没有深入考究,扯远了~

The Power of Parallel Computing for Large-Scale Data Warehousing and Analytics
联想到 Google 的结构化数据的分布存储系统——BigTable。BigTable同时使用了 GFS 和 MapReduce;就连GAE数据默认也是存储到BigTable里。还能联想到MySQL的表分区,拆表等,可惜没有深入考究,扯远了~
9 - 10-4 1:24
404 深圳也有同类产品——ASTER,数据处理上由集群加MapReduce实现


看官网介绍:
查询上比传统RDBMS要快10倍;
简单地单击就能将数据从 GB 扩充升级到 PB级别;
可以缩减10倍的硬件成本;
貌似跟MySpace.com有合作,应该是收费服务。


看官网介绍:
查询上比传统RDBMS要快10倍;
简单地单击就能将数据从 GB 扩充升级到 PB级别;
可以缩减10倍的硬件成本;
貌似跟MySpace.com有合作,应该是收费服务。
回到顶部 | Server | 返回 ChinaonRails 首页 | 注册 | 找回密码














