-
saiku (branch 3.8-release)构建步骤
所属栏目:[大数据] 日期:2021-05-15 热度:59
近日整理了saiku(branch 3.8-release)的构建步骤,分享出来以供大家参考 红色的为原有被注释的 绿色的为添加的 蓝色地方比较重要,为我修改的地方,与上方红色对照下 前提是需要下载mondrian-4.3.0.1-SPARK的包放到自己的nexus中 源码地址: ? ?? https:[详细]
-
??案例|:PayPal如何利用大数据分析提升业绩和打击欺诈?(信息
所属栏目:[大数据] 日期:2021-05-15 热度:114
副标题#e# 编者注:经常海淘或出国的朋友对“PayPal”肯定很熟悉,在北美及欧洲,PayPal的地位相当于中国的支付宝。每天要准确无误的处理来自全球的交易数据,PayPal是如何做到的呢?这篇文章将详细为大家介绍。 PayPal,就是我们通常说的“PayPal贝宝国际[详细]
-
R语言做文本挖掘 Part2分词处理
所属栏目:[大数据] 日期:2021-05-15 热度:168
副标题#e# ?? 转载:http://www.voidcn.com/article/p-qkxmglmf-pw.html Part2分词处理 【发现有人转载,决定把格式什么重新整理一遍,有时间做个进阶版文本挖掘,恩!原文地址:CSDN-R语言做文本挖掘 Part2分词处理】 在RStudio中安装完相关软件包之后,才[详细]
-
重视BI分析工具 光有想法是不够的
所属栏目:[大数据] 日期:2021-05-15 热度:139
点击上方蓝色字体关注。 您还可以搜索公众号“ D1net”选择关注D1net旗下的各领域(云计算,数据中心,大数据,CIO,企业协作,网络数通,信息安全,企业移动应用,系统集成,服务器,存储,呼叫中心,视频会议,视频监控等)的子公众号。 ======= 虽然认[详细]
-
数盟说 | 用文本挖掘找出50年以来最流行的音乐
所属栏目:[大数据] 日期:2021-05-15 热度:198
【数盟致力于成为最卓越的数据科学社区,聚焦于大数据、分析挖掘、数据可视化领域,业务范围:线下活动、在线课程、猎头服务、项目对接】 本文为数盟原创译文,转载请注明出处,并务必保留本文底部二维码。 从1958年开始每年十二月Billboard都会发布一个年[详细]
-
PrefixSpan序列模式挖掘算法
所属栏目:[大数据] 日期:2021-05-14 热度:94
介绍 与GSP一样,PrefixSpan算法也是序列模式分析算法的一种,不过与前者不同的是PrefixSpan算法不产生任何的侯选集,在这点上可以说已经比GSP好很多了。PrefixSpan算法可以挖掘出满足阈值的所有序列模式,可以说是非常经典的算法。序列的格式就是上文中提[详细]
-
logminer挖掘不同数据库的归档日志,使用redo log数据字典
所属栏目:[大数据] 日期:2021-05-14 热度:79
挖掘要求: 使用测试库挖掘生产库的归档日志,生产库未设置utl_file_dir参数,生产库不能重启,无法抽取出生产库的数据字典 挖掘方法: 将生产区数据库的数据字典抽取到redo log 中,将有数据字典的redo log一块加载入logminer,使用redo log中的数据字典进[详细]
-
大数据分析查询引擎Impala
所属栏目:[大数据] 日期:2021-05-14 热度:56
副标题#e# 来自标点符的《大数据分析查询引擎Impala》 作者:标点符(钱魏 Way) 链接:http://www.biaodianfu.com/impala.html Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系[详细]
-
1.大道至简的数据处理工具(Power Query)
所属栏目:[大数据] 日期:2021-05-14 热度:126
? ?如果你不想学复杂的函数,如果不想学更难的VBA。但你想把数据处分分析工作做好。那么,来吧!这套课程将是你最好的选择。远离繁杂,回归简单与智能化。 ? ?先来看看power query 怎么做些什么。先来展示一下效果图。[详细]
-
9个最佳的大数据处理编程语言
所属栏目:[大数据] 日期:2021-05-14 热度:157
大数据的浪潮仍在继续。它渗透到了几乎所有的行业,信息像洪水一样地席卷企业,使得软件越发庞然大物,比如Excel看上去就变得越来越笨拙。数据处理不再无足轻重,并且对精密分析和强大又实时处理的需要变得前所未有的巨大。 那么,在巨大的数据集中进行筛[详细]
-
大数定律和中心极限定理的中文叙述
所属栏目:[大数据] 日期:2021-05-14 热度:112
大数定律和中心极限定理的中文叙述 一、大数定律 1.切比雪夫大数定律 叙述:{Xn}随机变量序列,满足①相互独立;②方差D(X)存在并且一致有上界; 那么{Xn}服从大数定律——随机变量的平均值依概率收敛到随机变量的期望,当n很大时; 体现了均值的稳定性。[详细]
-
手慢无|StuQ邀你免费参加付费小班课大数据分析平台的首节预演
所属栏目:[大数据] 日期:2021-05-14 热度:142
副标题#e# 是的,你没有看错。可以免费观看 StuQ 精品付费小班课预演啦,小编又给大家谋福利了。 什么是『付费小班课预演』 付费小班课:直播辅导教学,1位领域专家与30位学员团结在一起,连续7周,只为一个共同目标,学会一个职业技能。全程使用StuQ视频直[详细]
-
用户研究基础流程和 SPSS 快速数据处理
所属栏目:[大数据] 日期:2021-05-14 热度:118
本公众号为阿里巴巴集团 CCOUX 所属,我们会定期为您推送一些用户体验相关的原创以及一些国外文章的翻译,希望您会喜欢并关注我们。请点击上方「37点2度体验」关注我们吧! 尽管基于在线行为监测的业务数据分析越来越被企业重视,在用户研究领域,问卷调查[详细]
-
文本挖掘分析《欢乐颂》到底谁和谁堪称好闺蜜、谁和谁又最为般配
所属栏目:[大数据] 日期:2021-05-14 热度:184
? 听说最近大家都在看《欢乐颂》,这部热剧里,女性可谓是绝对的主角,22楼5个女房客的互动好像把男性角色们的风头都抢光了;但是热门剧中又总是不能缺了言情戏的点缀。所以,《欢乐颂》到底谁和谁堪称好闺蜜、谁和谁又最为般配呢?还是让文本挖掘为你揭晓[详细]
-
UVA 11582 巨大数的斐波那契数列 (大数取模,幂取模,模的计算方
所属栏目:[大数据] 日期:2021-01-30 热度:152
Problem F: Colossal Fibonacci Numbers! The?i'th Fibonacci number?f?(i)?is recursively defined in the following way: f?(0) = 0?and?f?(1) = 1 f?(i+2) = f?(i+1) + f?(i)??for every?i?≥?0 Your task is to compute some values of this sequence.[详细]
-
关于BI(4)-企业如何提高“数据文化水平”
所属栏目:[大数据] 日期:2021-01-26 热度:81
http://www.searchbi.com.cn/showcontent_90396.htm 企业如何提高“数据文化水平” 日期:2015-9-1作者:Ed Burns翻译:曾少宁来源:TechTarget中国英文 数据文化???数据驱动???大数据应用???商业智能???数据战略??? 【TechTarget中国原创】 许多公司在谈[详细]
-
判断数组中包含重复数(大数中取重复)
所属栏目:[大数据] 日期:2021-01-26 热度:178
判断数字是否出现在40亿个数中;找出一组数中不重复的数字,即只出现一次的数字;判断一个成员个数为n,成员取值在1 ~ n的数组中是否有重复的成员 问题一 给40亿个不重复的unsigned int的整数,没排过序的,然后再给几个数,如何快速判断这几个数是否在那4[详细]
-
LinkedIn文本分析平台:主题挖掘的四大技术步骤
所属栏目:[大数据] 日期:2021-01-26 热度:54
副标题#e# 作者?Yongzheng (Tiger) Zhang?,译者?木环 LinkedIn前不久发布两篇文章分享了自主研发的文本分析平台Voices的概览和技术细节。LinkedIn认为倾听用户意见回馈很重要,发现反馈的主要话题、用户的热点话题和痛点,能够做出改善产品、提高用户体验[详细]
-
1块钱|2小时掌握快捷的数据处理工具与方法
所属栏目:[大数据] 日期:2021-01-26 热度:109
优才学院线上公开课 公众号内回复 “20160730”报名 ? 7月30日(周六)20:00 直播 ? 本次课为7月28日《Shell和PHP高效处理大数据》的第二部分,也是核心部分,已经报过名的童鞋不用再报名,新报名的童鞋可免费获得上一节课的视频回放,同时免费获得大福袋[详细]
-
我是如何进行文件操作类漏洞挖掘的?
所属栏目:[大数据] 日期:2021-01-26 热度:159
0x00前言: 作者:李斌,现汽车之家高级安全工程师。曾职于奇虎360多年,熟悉代码审计、渗透测试等Web安全领域。乌云核心白帽子。 不知不觉代码审计的艺术系列已经陪大家走到了第十季,该系列文章已经有九篇非常经典的文章,之前没有看过的同学可以看看以下[详细]
-
大数据处理常用的数据结构
所属栏目:[大数据] 日期:2021-01-26 热度:119
随着互联网的兴起,越来越多的内容被放到互联网中,从而导致海量数据处理受到更多人的重视,尤其是在百度、腾讯等这些涉及海量数据的公司。下面我们简单谈一下关于海量数据处理的一些常用数据结构。包括哈希、bitmap、Bloom filter、堆、mapreduce、trie树[详细]
-
为什么要BI(商业智能)
所属栏目:[大数据] 日期:2021-01-26 热度:106
参考链接 http://blog.csdn.net/bi_worker/article/details/51732770[详细]
-
【Power BI Desktop】开始篇
所属栏目:[大数据] 日期:2021-01-25 热度:60
什么是Power BI Desktop? Microsoft Power BI 會將貴公司的資料轉換成方便您收集及組織的各種視覺效果,讓您可以專注於所關切的事項。隨時掌握最新資訊,找出進行中的趨勢,並進一步推動業務。 目前免费 官网 Power BI Desktop目前没有中文官网,但是放出[详细]
-
Power BI for Office 365 概览
所属栏目:[大数据] 日期:2021-01-25 热度:62
伴随着数据量的日益增长,通过自服务式的商业智能把数据转换成辅助决策支持的工具,越来越成为迫切的需求。在以前,处理这些数据往往只是IT人员范围内的事,但是通过Power BI for Office 365里面的新功能喝服务,微软降低了这个门槛。它里面都是基于大多数[详细]
-
Power BI视频
所属栏目:[大数据] 日期:2021-01-25 热度:82
视频地址:http://v.qq.com/boke/page/f/0/5/f0151lukf55.html 视频地址:http://v.qq.com/boke/page/s/0/j/s0309kisp9j.html[详细]