千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機構(gòu)

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > 【操作教程】累加器和廣播變量在哪些場景使用

【操作教程】累加器和廣播變量在哪些場景使用

來源:千鋒教育
發(fā)布人:syq
時間: 2022-07-22 17:55:00 1658483700

  累加器和廣播變量在哪些場景使用?累加器是分布式的并且共享只寫變量。如果在轉(zhuǎn)換運算符中調(diào)用了累加器,并且沒有后續(xù)的動作運算符,則不會執(zhí)行累加器。如果后面兩次調(diào)用action操作符,累加器會被執(zhí)行兩次,導致過度加法。

累加器和廣播變量在哪些場景使用

  1、廣播變量的使用介紹

  解決的場景:

1

  將Driver進程的共享數(shù)據(jù)發(fā)送給所有子節(jié)點的Executor進程的每個任務。如果不使用廣播變量技術,Driver端默認會將共享數(shù)據(jù)分發(fā)給各個[Task],對網(wǎng)絡分發(fā)造成很大壓力。

  如果采用廣播變量技術,Driver端的共享數(shù)據(jù)只會發(fā)送給每個[Executor]。 Executor 中的所有任務都重用這個對象。確保共享對象是[可序列化的]。因為跨節(jié)點傳輸?shù)臄?shù)據(jù)必須是可序列化的。

  將共享對象廣播到Driver端的每個Executor:

  val bc = sc.broadcast(共享對象)

  在執(zhí)行器中獲得:

  bc.值

  2、累加器的使用方法

  集群中的所有 Executor 對同一個變量執(zhí)行累積操作。 Spark 目前只支持累加 [add] 操作。內(nèi)置3個累加器:【LongAccumulator】、【DoubleAccumulator】、【CollectionAccumulator】。

  如何使用整數(shù)累加器?

  在Driver端定義整數(shù)累加器并賦初值。

  acc=sc.accumulator(0)

  Executor端每次累加1

  acc+=1

  或者 acc.add(1)

2

  3、綜合案例

3

4

  以上代碼不僅練習了累加器和廣播變量在哪些場景使用,還練習了如何使用函數(shù)式編程(Map、Filter),如何創(chuàng)建上下文變量,以及如何使用并行性。這些練習比較全面,希望能幫助你學習更多技能。更多關于IT大數(shù)據(jù)培訓的問題,歡迎咨詢千鋒教育在線名師,如果想要了解我們的師資、課程、項目實操的話可以點擊咨詢課程顧問,獲取試聽資格來試聽我們的課程,在線零距離接觸千鋒教育大咖名師,讓你輕松從入門到精通。

tags:
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強師集結(jié),手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內(nèi)將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT