当前位置: 首页 > news >正文

网站建设分析方法新网网站空间到期停了 咋续费

网站建设分析方法,新网网站空间到期停了 咋续费,怎么做网页赚钱,微信小程序怎么做网站数据倾斜定义:顾名思义,就是大量相似或相同数据聚集在一个块的节点里,导致计算和资源分配不均导致的计算缓慢(长尾)问题。 数据倾斜原因: count(distinct field) group by NULL 空值 Shuffle (概率最…

数据倾斜定义:顾名思义,就是大量相似或相同数据聚集在一个块的节点里,导致计算和资源分配不均导致的计算缓慢(长尾)问题。

数据倾斜原因:

count(distinct field)

group by 

NULL 空值

Shuffle (概率最高、发生最普遍的数据倾斜问题,本文重点讲述这个)

###################################################

先说解决方案:

1.相同值打散

各个论坛、博文写的最多的一种,最好理解的,对于NULL、空字符串、等可以找到的值,加rand打散。

concat_ws('_',field,rand())
重点关注 concat和 concat_ws 的区别是什么,面试和开发中的坑 经常遇见。

2.全局打散

主要解决的场景是大表和大表进行关联Join,注意如果是小表的话,直接mapjoin 采用广播即可解决。

大表和大表全局打散的思路:就是对左表(假设左表键倾斜)进行rand打散,本例举例10倍(注意这里还有优化空间,就是方法三),对右表进行explode,行转列,膨胀10倍。代码实操:

3.局部打散

局部打散主要解决超大的两张进行关联,在公司某搜索场景下,A、B表为不固定倾斜键,百亿和十亿的数据计算,为提升性能,特封装此方法。查找倾斜键,并只对倾斜键进行膨胀,如果膨胀10倍,注意右表是11倍的行转列。

# 伪代码:不理解可以再提问
select A.window_nums,
R.uid_concat
from (select case when replierUid ='0' or replierUid is null then rand()when window_nums > 100000  then concat_ws('_',replierUid,cast(ceiling(rand() * 10) as int))from(select row_number() over(partition by if(replierUid ='0',rand(),replierUid) order by aid) as window_numsfrom table_a) A1
) A left outer join(select *,concat_ws('_',uid, rand_num) as uid_concatfrom R lateral view explode(getGenergeCode(10)) tmp_tbl as rand_numunion allselect *,null,concat_ws('_',uid) as uid_concatfrom R
) R ON (A.touid_concat =R.uid_concat)
  /*** 输入* @author :费元星* @param key 输入数值* @return 返回容积为数值大小,步长为1的数组* @Demo : spark.udf.register("getGenergeCode", DataCenterUtils.getGenergeCode _)*/def getGenergeCode(key: Int): Array[Int] = {return scala.Array.range(1, key + 1, 1)}def main(args: Array[String]): Unit = {for (x <- getGenergeCode(10)) {print(" " + x)}println()}/** spark.udf.register("getGenergeCode", DataCenterUtils.getGenergeCode _) */

4.在局部打散基础上,可以采用局部多段打散,目前生产环境中还未遇到,感兴趣的网友可以试试这个思路。

5.一顿操作猛如虎,有没有更牛的解决方案,答案有:采用Spark Dce,百度和英特尔联合开发的基于硬件的shuffle解决方案,和负责人在内部分享会上交流过,形成一个共同的结论,如果能在集群底层将各种问题封装好,不暴露给使用用户RD是最佳的方案。

6.当然除此之外,开源也有一些解决方案,AQE等,后面有时间可以再出一篇AQE源码详解,也有一些没解决很好的问题,例如倾斜键识别。

http://www.bjxfkj.com.cn/article/108183.html

相关文章:

  • 建设网站明细报价表龙岗区住房和建设局网站
  • 好女人生活常识网站建设购物网站商城
  • 零基础学建站重庆设计有限公司
  • 佛山网站优化公司排名网站版面在线设计
  • 开发网站的流程细节微信营销的模式
  • 开发网站需要什么技术2022甘肃交通工程建设监理有限公司网站
  • 阿里云备案网站服务内容怎么填搭建网站是要什么
  • 企业网站备案要多久网站建设店
  • 手机端网站建设郑州思茅网站建设
  • 用dw做教学网站太原网站设计
  • 网站视觉风格可在哪些网站做链接
  • 云服务器建设网站教程图片在线制作二维码生成器
  • 定制自动化营销如何seo推广
  • 自己建个购物网站建筑网络图
  • 彩票网站开发有连带万网虚拟机wordpress
  • 公司用于做网站的费用怎么做账咸宁网站建设解决方案
  • 国内有哪些响应式网站怎样做网站初中生
  • 做网站用什么软件方便购物网站每个模块主要功能
  • 如何做好公司网站建设wordpress站长
  • 网站接入协议及接入商资质对于高校类建设网站的要求
  • 爱站网长尾关键词挖掘工具下载怎么用ftp清空网站
  • 请输入搜索关键词上海百度seo优化
  • intitle 网站建设安徽两学一做网站
  • 建站经验 网站建设学院云南旅游
  • 国外域名注册哪个网站好wordpress如何做产品展示
  • 建设娱乐网站的要求上海工程造价咨询公司
  • 网站简繁体转换代码移动端下载app
  • 提高网站公信力 单仁wordpress图片远程
  • 致和网站建设南宁网络推广系统
  • 口碑好的丹徒网站建设网站建设工作简介