• Opencc_Installation_Error

    Compile and Install OpenCC on Minimal CentOS 7測試過程在虛擬機中進行,使用vm搭建,操作系統版本CentOS Linux release 7.2.1511 (Core),內核版本3.10.0-327.10.1.e。

    Pandora学习笔记

    Pandora学习笔记架构图控制台操作实时计算工作流:创建数据源在工作流编辑器中,我们首先看到的节点是数据源,这个节点用来接收用户的实时数据,也就是说,当这个节点被创建后,用户需要将自己的数据推送至这个数据源中,才可以继续进行下一步。定义字段及类型类型:st。

    SparkLivy&Zeppelin&HDFS_mutil-user&auth

    关于SparkLivy和ZeppelinNotebook访问HDFS时的多用户权限控制SparkLivy在Yarn上运行应用时,默认使用的用户是Livy。ZeppelinNotebook在使用%Spark等非%Livy的Interpreter时,使用的用户是。

    Zeppelin-Shiro

    配置Zeppelin使用Apache Shiro进行鉴权(多用户登录)本人使用的Ambari搭建的Hadoop集群,Zeppelin也是Ambari管理的集群中的一部分。Ambari安装集群方法见本人的另外一篇文章Ambari安装Hadoop集群教程Zepp。

    jieba&word2vec

    Ubuntu/Python 结巴分词 + Word2Vec利用维基百科训练词向量结巴分词是一个跨语言的中文分词器,整体效果还算不错,功能也够用,这里直接用Python了,其他主流语言版本均有提供。Word2Vec,起源于谷歌的一个项目,在我刚开始接触的时候就。