PiFlow官方版(大数据流水线系统)是一款行业软件软件,officeba免费提供PiFlow官方版(大数据流水线系统)下载,更多PiFlow官方版(大数据流水线系统)相关版本就在officeba。
PiFlow是一款十分强劲的互联网大数据生产流水线系统软件,复合型科学研究互联网大数据生产流水线系统软件,这款系统软件将数据收集、存储的等阶段封装成部件,pc软件简易应用非常容易,给予100 的数据处理方法部件,如果有必须盆友的能够来本网站免费下载试一下。
简易实用。
数据可视化配备生产流水线。
监管生产流水线。
查询生产流水线日志。
控制点作用。
扩展性强:
适用自定开发设计数据处理方法部件。
使用性能:
根据分布式计算模块Spark开发设计。
功能齐全:
给予100 的数据处理方法部件。
包含Hadoop 、Spark、MLlib、Hive、Solr、Redis、MemCache、ElasticSearch、JDBC、MongoDB、HTTP、FTP、XML、CSV、JSON等。
集成化了微生物菌种行业的有关优化算法。
缓解压力piflow-server-v0.9.tar.gz。
tar -zxvf piflow-server-v0.9.tar.gz。
编写环境变量config.properties。
运作、终止、重新启动PiFlow Server。
start.sh、stop.sh、 restart.sh、 status.sh。
检测 PiFlow Server。
设定系统变量 PIFLOW_HOME。
vim /etc/profile。
export PIFLOW_HOME=/yourPiflowPath/bin。
export PATH=PATH:PIFLOW_HOME/bin。
运作以下指令。
piflow flow start example/mockDataFlow.json。
piflow flow stop appID。
piflow flow info appID。
piflow flow log appID。
piflow flowGroup start example/mockDataGroup.json。
piflow flowGroup stop groupId。
piflow flowGroup info groupId。
如何配置config.properties。
#spark and yarn config。
spark.master=yarn。
spark.deploy.mode=cluster。
#hdfs default file system。
fs.defaultFS=hdfs://10.0.86.191:9000。
#yarn resourcemanager.hostname。
yarn.resourcemanager.hostname=10.0.86.191。
#if you want to use hive, set hive metastore uris。
#hive.metastore.uris=thrift://10.0.88.71:9083。
#show data in log, set 0 if you do not want to show data in logs。
data.show=10。
#server port
server.port=8002
#h2db port
h2.port=50002