当前位置: 首页 > news >正文

网站建设的方法有哪些方面如何将自己 做的网站发布网上

网站建设的方法有哪些方面,如何将自己 做的网站发布网上,深圳注册公司多少钱,保健食品东莞网站建设1. 输出为Python对象 collect算子:将RDD各个分区内的数据,统一收集到Driver中,形成一个List对象 reduce算子:对RDD数据集按照传入的逻辑进行聚合 take算子:取RDD的前N个元素,组合成list返回给你 count…

1. 输出为Python对象 

collect算子:将RDD各个分区内的数据,统一收集到Driver中,形成一个List对象

reduce算子:对RDD数据集按照传入的逻辑进行聚合

take算子:取RDD的前N个元素,组合成list返回给你

count算子:计算RDD有多少条数据,返回值是一个数字

# collect算子:将RDD各个分区内的数据,统一收集到Driver中,形成一个List对象
# 语法:rdd.collect()  # 返回一个listfrom pyspark import SparkConf, SparkContext
import osos.environ['PYSPARK_PYTHON'] = "D:/Program Files/Python3.11.4/python.exe"
conf = SparkConf().setMaster("local[*]").setSparkHome("test_spark")
sc = SparkContext(conf=conf)rdd = sc.parallelize([1, 2, 3, 4, 5])
my_list = rdd.collect()
print(my_list)  # [1, 2, 3, 4, 5]
print(type(my_list))  # <class 'list'># reduce算子:对RDD数据集按照传入的逻辑进行聚合
# 语法:rdd.reduce(func)
#   func(T,T) - > T   # 两个参数,一个返回值,且类型一致
num = rdd.reduce(lambda a, b: a + b)
print(num)  # 15# take算子:取RDD的前N个元素,组合成list返回给你
take_list = rdd.take(3)
print(take_list)  # [1, 2, 3]# count算子:计算RDD有多少条数据,返回值是一个数字
num_count = rdd.count()
print(num_count)  # 5

2. 输出到文件中

saveAsTextFile算子:将RDD的数据写入文本文件中

修改RDD分区为1个

  • 方式1:SparkConf对象设置属性全局并行度为1
  • 方式2:创建rdd的时候设置(parallelize方法传入numSlices参数为1)
# Spark数据输出到文件中
# saveAsTextFile算子:将RDD的数据写入文本文件中
from pyspark import SparkConf, SparkContext
import osos.environ['PYSPARK_PYTHON'] = "D:/Program Files/Python3.11.4/python.exe"
conf = SparkConf().setMaster("local[*]").setSparkHome("test_spark")
sc = SparkContext(conf=conf)# 修改RDD分区为1个
# 方式1:SparkConf对象设置属性全局并行度为1
conf.set("spark.default.parallelism", "1")
# 方式2:创建rdd的时候设置(parallelize方法传入numSlices参数为1)
rdd1 = sc.parallelize([1, 2, 3, 4, 5], numSlices=1)
# rdd1 = sc.parallelize([1, 2, 3, 4, 5],1)# rdd1 = sc.parallelize([1, 2, 3, 4, 5])
rdd2 = sc.parallelize([("hello", 3), ("Spark", 5), ("Hi", 7)])
rdd3 = sc.parallelize([[1, 3, 5], [6, 7, 9], [11, 13, 11]])rdd1.saveAsTextFile("./output1")
rdd2.saveAsTextFile("./output2")
rdd3.saveAsTextFile("./output3")

http://www.bjxfkj.com.cn/article/108708.html

相关文章:

  • 网站搭建dns有用吗wordpress两个菜单栏
  • 网站备案去哪做官网设计好的公司
  • 微网站管理平台淘宝客如何做淘宝客网站推广
  • 湖南seo网站多少钱山西建设厅报名网站
  • 学校网站建设方案模板下载黄骅贴吧2020招聘信息
  • 犀牛做网站的公司四川网站建设公司 会员登录
  • jsp网站开发文献完美代码网站
  • 杭州企业网站制作哪个好大众点评网站模板
  • wordpress新建站网页不显示图片信息流广告的核心是
  • 网站建设徐州百度网络网站wordpress开发架构
  • 网站建设推广济南兴田德润优惠吗桂林网站建设 腾云
  • 制作网站推广网站建设公司怀化
  • 上海做网站多少费用免费模板
  • 西安h5响应式网站网站页面设计模板图片
  • 网站建设未来网页设计师工资一般多少钱一个月
  • 简述建设网站的步骤6网站后台登入密码忘记了
  • 成都新线加做网站手机网站成功案例
  • 网站开发需要懂多少代码网站建设和关键词优化技巧
  • 公司做网站需要哪些资料搞笑视频网站建设策划书
  • 南京做网站公司地点百度爱采购网站
  • 自己建站网站注册新公司网上核名网站
  • 链接提取视频的网站单位做网站资料需要什么软件
  • 网站怎么做组织图discuz 转wordpress
  • 网监关闭的网站怎么恢复dw做网站设计
  • 做网站还是做app好搭建邮箱网站
  • 广州专业网站优化公司搜索推广账户优化
  • 免费自助建站系统有哪些合肥网络公司十大排名
  • 专业邯郸做网站东莞松山湖凯悦酒店
  • 网站的源码营销推广与策划
  • 网站建设标准规范北京公关公司