千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站
千鋒教育

千鋒學(xué)習(xí)站 | 隨時(shí)隨地免費(fèi)學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻
千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時(shí)隨地免費(fèi)學(xué)習(xí)課程

當(dāng)前位置:首頁  >  技術(shù)干貨  > 發(fā)現(xiàn)一個(gè)寶藏Python庫,玩社區(qū)發(fā)現(xiàn)算法的不能錯(cuò)過!

發(fā)現(xiàn)一個(gè)寶藏Python庫,玩社區(qū)發(fā)現(xiàn)算法的不能錯(cuò)過!

來源:千鋒教育
發(fā)布人:wjy
時(shí)間: 2023-01-13 10:41:00 1673577660

  網(wǎng)絡(luò)是由一些緊密相連的節(jié)點(diǎn)組成的,并且根據(jù)不同節(jié)點(diǎn)之間連接的緊密程度,網(wǎng)絡(luò)也可視為由不同簇組成。簇內(nèi)的節(jié)點(diǎn)之間有著更為緊密的連接,不同簇之間的連接則相對(duì)稀疏。這種簇被稱為網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)(community structure)。

  由此衍生出來的社區(qū)發(fā)現(xiàn)(community detection)算法用來發(fā)現(xiàn)網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu),這類算法包括 Louvain 算法、Girvan-Newman 算法以及 Bron-Kerbosch 算法等。

  最近,在 GitHub 上發(fā)現(xiàn)了一個(gè)可以發(fā)現(xiàn)圖中社區(qū)結(jié)構(gòu)的 Python 庫 communities,該庫由軟件工程師 Jonathan Shobrook 創(chuàng)建。

寶藏 Python 庫1

  項(xiàng)目地址:https://github.com/shobrook/communities

  首先,該庫可以實(shí)現(xiàn)以下幾種社區(qū)發(fā)現(xiàn)算法:

  Louvain 算法

  Girvan-Newman 算法

  層次聚類

  譜聚類

  Bron-Kerbosch 算法

  其次,用戶還可以使用 communities 庫來可視化上述幾種算法。

  該庫的安裝方法也非常簡(jiǎn)單,可采用 pip 的方式安裝 communities,代碼如下:

寶藏 Python 庫2

  對(duì)于這個(gè) Python 庫,很多網(wǎng)友給予了高度評(píng)價(jià),表示會(huì)去嘗試。

寶藏 Python 庫3

  算法詳解

  1、Louvain 算法

寶藏 Python 庫4

  該算法來源于文章《Fast unfolding of communities in large networks》,簡(jiǎn)稱為 Louvian。

  作為一種基于模塊度(Modularity)的社區(qū)發(fā)現(xiàn)算法,Louvain 算法在效率和效果上都表現(xiàn)比較好,并且能夠發(fā)現(xiàn)層次性的社區(qū)結(jié)構(gòu),其優(yōu)化的目標(biāo)是最大化整個(gè)圖屬性結(jié)構(gòu)(社區(qū)網(wǎng)絡(luò))的模塊度。

  Louvain 算法對(duì)最大化圖模塊性的社區(qū)進(jìn)行貪婪搜索。如果一個(gè)圖具有高密度的群體內(nèi)邊緣和低密度的群體間邊緣,則稱之為模圖。

  示例代碼如下:

寶藏 Python 庫5

  2、Girvan-Newman 算法

寶藏 Python 庫6

  該算法來源于文章《Community structure in social and biological networks》。

  Girvan-Newman 算法迭代刪除邊以創(chuàng)建更多連接的組件。每個(gè)組件都被視為一個(gè) community,當(dāng)模塊度不能再增加時(shí),算法停止去除邊緣。

  示例代碼如下:

寶藏 Python 庫7

  3、層次聚類

寶藏 Python 庫8

  層次聚類實(shí)現(xiàn)了一種自底向上、分層的聚類算法。每個(gè)節(jié)點(diǎn)從自己 的社區(qū)開始,然后,隨著層次結(jié)構(gòu)的建立,最相似的社區(qū)被合并。社區(qū)會(huì)一直被合并,直到在模塊度方面沒有進(jìn)一步的進(jìn)展。

  示例代碼如下:

寶藏 Python 庫9

  4、譜聚類

寶藏 Python 庫10

  這種類型的算法假定鄰接矩陣的特征值包含有關(guān)社區(qū)結(jié)構(gòu)的信息。

  示例代碼如下:

寶藏 Python 庫11

  5、Bron-Kerbosch 算法

寶藏 Python 庫12

  Bron-Kerbosch 算法實(shí)現(xiàn)用于最大團(tuán)檢測(cè)(maximal clique detection)。圖中的最大團(tuán)是形成一個(gè)完整圖的節(jié)點(diǎn)子集,如果向該子集中添加其他節(jié)點(diǎn),則它將不再完整。將最大團(tuán)視為社區(qū)是合理的,因?yàn)閳F(tuán)是圖中連接最緊密的節(jié)點(diǎn)群。因?yàn)橐粋€(gè)節(jié)點(diǎn)可以是多個(gè)社區(qū)的成員,所以該算法有時(shí)會(huì)識(shí)別重疊的社區(qū)。

  示例代碼如下:

寶藏 Python 庫13

  可視化

  繪圖

寶藏 Python 庫14

  可視化圖(graph),將節(jié)點(diǎn)分組至它們所屬的社區(qū)和顏色編碼中。返回代表繪圖的 matplotlib.axes.Axes。示例代碼如下:

寶藏 Python 庫15

  可視化圖如下:

寶藏 Python 庫16

  Louvain 算法的動(dòng)圖展示

寶藏 Python 庫17

  Louvain 算法在圖中的應(yīng)用可以實(shí)現(xiàn)動(dòng)圖展示,其中每個(gè)節(jié)點(diǎn)的顏色代表其所屬的社區(qū),并且同一社區(qū)中的節(jié)點(diǎn)聚類結(jié)合在一起。

  示例代碼如下:

寶藏 Python 庫18

tags:
聲明:本站稿件版權(quán)均屬千鋒教育所有,未經(jīng)許可不得擅自轉(zhuǎn)載。
10年以上業(yè)內(nèi)強(qiáng)師集結(jié),手把手帶你蛻變精英
請(qǐng)您保持通訊暢通,專屬學(xué)習(xí)老師24小時(shí)內(nèi)將與您1V1溝通
免費(fèi)領(lǐng)取
今日已有369人領(lǐng)取成功
劉同學(xué) 138****2860 剛剛成功領(lǐng)取
王同學(xué) 131****2015 剛剛成功領(lǐng)取
張同學(xué) 133****4652 剛剛成功領(lǐng)取
李同學(xué) 135****8607 剛剛成功領(lǐng)取
楊同學(xué) 132****5667 剛剛成功領(lǐng)取
岳同學(xué) 134****6652 剛剛成功領(lǐng)取
梁同學(xué) 157****2950 剛剛成功領(lǐng)取
劉同學(xué) 189****1015 剛剛成功領(lǐng)取
張同學(xué) 155****4678 剛剛成功領(lǐng)取
鄒同學(xué) 139****2907 剛剛成功領(lǐng)取
董同學(xué) 138****2867 剛剛成功領(lǐng)取
周同學(xué) 136****3602 剛剛成功領(lǐng)取
相關(guān)推薦HOT
工業(yè)機(jī)器人、自動(dòng)化、PLC三者是什么關(guān)系?

一、工業(yè)機(jī)器人和自動(dòng)化工業(yè)機(jī)器人是自動(dòng)化技術(shù)的一部分,是自動(dòng)化生產(chǎn)線的關(guān)鍵組件之一。在自動(dòng)化生產(chǎn)線中,工業(yè)機(jī)器人被廣泛應(yīng)用于執(zhí)行各種任...詳情>>

2023-10-15 01:41:38
為什么Redis要對(duì)一種數(shù)據(jù)類型存儲(chǔ)兩次呢?

一、實(shí)現(xiàn)快速數(shù)據(jù)訪問Redis是一種高性能的內(nèi)存數(shù)據(jù)庫,將數(shù)據(jù)存儲(chǔ)在內(nèi)存中可以實(shí)現(xiàn)非??焖俚臄?shù)據(jù)讀取和訪問。為了進(jìn)一步提高數(shù)據(jù)的訪問速度,R...詳情>>

2023-10-15 01:40:32
什么是編程思想?

一、編程思想的定義和理念編程思想可以理解為一套指導(dǎo)編程活動(dòng)的理念和原則。它包括如何定義問題,如何設(shè)計(jì)解決方案,以及如何實(shí)現(xiàn)和測(cè)試這個(gè)解...詳情>>

2023-10-15 01:22:38
迭代開發(fā)模型中最容易出問題的階段是什么?

一、迭代開發(fā)模型中最容易出問題的階段是什么 在迭代開發(fā)模型中,最容易出問題的階段通常是需求收集和分析階段。在這個(gè)階段,開發(fā)團(tuán)隊(duì)需要與客...詳情>>

2023-10-15 01:03:52
軟件測(cè)試中bug管理工具Jira怎么樣?

一、Jira是什么 Jira是一款由澳大利亞軟件公司Atlassian開發(fā)的項(xiàng)目管理和問題跟蹤工具。它是一種用于敏捷項(xiàng)目開發(fā)和軟件開發(fā)過程中的工具,廣泛...詳情>>

2023-10-15 01:02:32
快速通道