地區(qū)
英國(guó)
美國(guó)
中國(guó)香港
新加坡
澳大利亞
院校庫
學(xué)校庫
專業(yè)庫
排名庫
認(rèn)證查詢
英國(guó)選校
學(xué)員錄取
成功案例
錄取報(bào)告
本科戰(zhàn)績(jī)
南極星計(jì)劃
留學(xué)資訊
背景提升
背提項(xiàng)目
實(shí)習(xí)內(nèi)推
高頻競(jìng)賽
背提免費(fèi)課
顧問團(tuán)隊(duì)
資料庫
關(guān)于我們
服務(wù)項(xiàng)目
指南動(dòng)態(tài)
聯(lián)系我們
App下載
本科留學(xué)
頂峰相見碩士教育展
開學(xué)季如何沖刺名校
2024錄取戰(zhàn)績(jī)
2025 QS
英國(guó)留學(xué)選校查詢
登錄
收獲QS Top 100統(tǒng)計(jì)學(xué)offer,我是如何學(xué)習(xí)數(shù)據(jù)分析技能的?
收藏已取消
收藏成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{!collectStatus ? '收藏' : '已收藏'}}
在線咨詢
收獲QS Top 100統(tǒng)計(jì)學(xué)offer,我是如何學(xué)習(xí)數(shù)據(jù)分析技能的?
收藏已取消
收藏成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{!collectStatus ? '收藏' : '已收藏'}}
指南者留學(xué) Journey
2022年06月22日
閱讀量:1846
<p style="text-align: justify;"><strong>學(xué)員背景</strong><br />F同學(xué)<br /><strong>本科背景</strong><br />廣東財(cái)經(jīng)大學(xué) 應(yīng)用統(tǒng)計(jì)專業(yè)<br />GPA 81.1 雅思7<br />指南者商業(yè)分析項(xiàng)目實(shí)戰(zhàn)學(xué)員<br /><strong>錄取學(xué)校(2022年秋季入學(xué))</strong><br /><a href="http://www.ivjr.cn/majr_51285" target="_blank" rel="noopener"><span style="text-decoration: underline; color: #1890ff;">南安普頓大學(xué)(QS排名78) 應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)</span></a><br /><strong>背提戰(zhàn)績(jī)</strong></p> <p style="text-align: justify;"><img style="width: 371px; height: 521px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpnyHSzV.jpg" width="371" height="521" /></p> <p style="text-align: justify;">前言:</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">距離項(xiàng)目結(jié)束已經(jīng)過去兩個(gè)月了,當(dāng)時(shí)參加這個(gè)項(xiàng)目的情形還歷歷在目。我是在今年1月初的時(shí)候報(bào)名這個(gè)項(xiàng)目的,其實(shí)當(dāng)時(shí)最擔(dān)心的問題是這個(gè)項(xiàng)目會(huì)不會(huì)很水,因?yàn)榫W(wǎng)絡(luò)上一直詬病于這些項(xiàng)目,但當(dāng)我真正參與到課程中去的時(shí)候,我發(fā)現(xiàn)我的想法是錯(cuò)誤的。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">項(xiàng)目中很多地方對(duì)我影響很大,當(dāng)然我也受益其中,這個(gè)項(xiàng)目強(qiáng)化了我的專業(yè)技能(提前學(xué)習(xí)數(shù)據(jù)分析和挖掘建模方面的技能),豐富了我的實(shí)踐經(jīng)歷,對(duì)我之后拿到研究生offer有直接有力的幫助。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">01 背景與契機(jī)</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">一開始選擇參加指南者的背景提升項(xiàng)目,是因?yàn)橛X得自己的項(xiàng)目經(jīng)歷太少再加上自己是雙非學(xué)校的背景,缺少具體的實(shí)戰(zhàn)經(jīng)驗(yàn),大學(xué)里參加的項(xiàng)目也很少。即使我是應(yīng)用統(tǒng)計(jì)專業(yè),在學(xué)校里學(xué)了R語言和SQL,但是<strong>Python的實(shí)際應(yīng)用一直是我的弱點(diǎn)</strong>,所以基于這個(gè)想法,我想?yún)⒓右粋€(gè)提升個(gè)人編程能力的項(xiàng)目。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">考慮到我后期我想申請(qǐng)港校和英國(guó)商業(yè)分析的方向,擁有相關(guān)的背景經(jīng)歷也是非常有必要的,<strong>國(guó)外的學(xué)校在BA這塊的錄取會(huì)特別注重申請(qǐng)者的數(shù)據(jù)分析和建模能力以及實(shí)踐經(jīng)驗(yàn)</strong>,這些都是我當(dāng)時(shí)比較缺少的幾點(diǎn)吧。包括我直系的師兄師姐和顧問老師也跟我說擁有幾段與碩士項(xiàng)目相似的經(jīng)歷會(huì)大大提高成功的概率,因?yàn)槟荏w現(xiàn)出自身與項(xiàng)目的匹配度。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">同時(shí)我未來的就業(yè)方向也是想往數(shù)據(jù)分析和商業(yè)分析這兩個(gè)方向,所以提前了解這個(gè)領(lǐng)域所必備的技能對(duì)以后就業(yè)或找實(shí)習(xí)都會(huì)有一定的好處?;谶@幾點(diǎn),我決定參加這個(gè)項(xiàng)目提升自己的背景與能力,最終收獲滿滿。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">02 項(xiàng)目介紹</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">我參加的這個(gè)項(xiàng)目的名字叫做基于電商大數(shù)據(jù)零食市場(chǎng)的分析,這個(gè)項(xiàng)目主要是收集各類淘寶村的店鋪數(shù)據(jù)和商品價(jià)格、銷量和人氣等數(shù)據(jù),以可視化和挖掘建模的方式解讀農(nóng)村淘寶的經(jīng)濟(jì)特征,從商品特色、品質(zhì)和口碑等方面,共同探究淘寶村如何實(shí)現(xiàn)興農(nóng)扶貧的目標(biāo)。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">本次項(xiàng)目的授課老師——王老師,他在bilibili平臺(tái)的Tableau可視化視頻幾年來穩(wěn)居第一,而且他本人也曾經(jīng)在世界知名的咨詢公司工作過很多年,能夠真正給到我一些很實(shí)用的建議,所以個(gè)人覺得同學(xué)們完全可以大膽去報(bào)名這個(gè)項(xiàng)目。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">關(guān)于學(xué)習(xí)的內(nèi)容,總共分為六大節(jié),上課所用到主要是以<strong>SQL、Python</strong>這兩大軟件為主,包括SQL的增刪改查、Python與numpy基礎(chǔ)、pandas、多分類問題、語義情感分析、預(yù)測(cè)與相關(guān)因素分析,最牛的莫過于是利用百度智能云進(jìn)行語句情感得分分析,直接調(diào)用一段代碼就可以了,大大減少了代碼的書寫時(shí)間提高了效率,關(guān)鍵<strong>這是我從來沒有在學(xué)校的一門課程里接觸到類似的知識(shí)</strong>,我認(rèn)為這也是項(xiàng)目中的一個(gè)亮點(diǎn)之一,緊跟現(xiàn)在人工智能的一個(gè)潮流。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">03 準(zhǔn)備過程</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">即使我是學(xué)統(tǒng)計(jì)專業(yè),但在實(shí)際的操作中也會(huì)遇到不少“困難”,有一些是十分低級(jí)的錯(cuò)誤,比如使用jupyter notebook的時(shí)候把小窗口直接關(guān)掉,導(dǎo)致了程序無法正常運(yùn)行,但是王老師還是十分耐心地告訴我一些需要注意的地方。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">這個(gè)項(xiàng)目里需要每周一次作業(yè),來檢查同學(xué)們的聽課情況,因?yàn)楫?dāng)時(shí)在寫畢業(yè)設(shè)計(jì),時(shí)間分配和把控上做得不是很好,沒怎么認(rèn)真聽課。所以想一次性利用課程的課件把作業(yè)完成好然后交給老師,但是沒想到當(dāng)中遇到不少問題,在群上詢問老師意見,一下子就被老師發(fā)現(xiàn)了,老師很嚴(yán)厲地批評(píng)了我,并語重心長(zhǎng)地對(duì)我說:<strong>編程是需要時(shí)間去練習(xí)的</strong>。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">從那時(shí)開始,我每周的課都聽三遍,并將代碼自己再運(yùn)行一遍,務(wù)必讓自己每一個(gè)知識(shí)點(diǎn)都掌握好,這樣操作下來感覺就沒有特別大的問題了,因?yàn)楹芏嚯y點(diǎn)都是老師所設(shè)計(jì)好的,相信自己一定是可以掌握的,還有給我的啟示就是日常需要有目的性地去練習(xí)編程,提高個(gè)人的編程能力,比如在牛客網(wǎng)、leetcode上多刷題,這些才是<strong>真正為以后就讀研究生甚至是就業(yè)做好充分的準(zhǔn)備</strong>。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">04 項(xiàng)目實(shí)戰(zhàn)</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">經(jīng)過一個(gè)多月的學(xué)習(xí)之后,我對(duì)Python和SQL已經(jīng)掌握得差不多了,在課程的最后就是需要進(jìn)行項(xiàng)目實(shí)操。個(gè)人猜測(cè),老師應(yīng)該運(yùn)用了web scraper插件在天貓上爬取了近3000多條數(shù)據(jù)以及商品的評(píng)論區(qū)的數(shù)據(jù),我們參加項(xiàng)目的同學(xué)進(jìn)行后續(xù)的操作。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">首先基本操作,先導(dǎo)入numpy和pandas包,然后對(duì)excel表格里的數(shù)據(jù)進(jìn)行處理,因?yàn)檎G闆r下獲取的數(shù)據(jù)都是會(huì)有異常值與缺失值,所以我依照老師在課程上講過的處理方法,利用pandas庫對(duì)二維數(shù)據(jù)表對(duì)空白值去除填充,并且定義新函數(shù)對(duì)發(fā)貨地址的省份與城市實(shí)現(xiàn)Excel中的分列功能,最后運(yùn)用數(shù)組與集合等知識(shí)來對(duì)列中不規(guī)則的信息有效提取出來,以獲得商品的具體分類。在這個(gè)過程中,老師還經(jīng)常提醒我們要定期對(duì)表內(nèi)的信息進(jìn)行檢查,不然會(huì)影響到后續(xù)的操作。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">這個(gè)項(xiàng)目中最精彩的部分估計(jì)就是<strong>Tableau</strong>部分了,做出很多意義的圖表,但我一開始沒有什么方向,十分著急,不知道怎么辦好。后面老師給出不同的方向,發(fā)貨地址、店鋪銷量分析、單品分析,并且利用詞云wordart 做出評(píng)論區(qū)頻次最高的詞匯,消費(fèi)者對(duì)產(chǎn)品的態(tài)度一目了然。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">當(dāng)然這些僅僅停留在描述統(tǒng)計(jì)的范疇里面,是經(jīng)不起考驗(yàn)的。后面我們需要借助統(tǒng)計(jì)模型建立多元線性回歸模型和PCA模型,利用相關(guān)理論進(jìn)行必要的降維,導(dǎo)入seaborn和matplotlib包最后繪制出熱力圖,不同變量之間的相關(guān)性通過顏色的深淺就可以看出。最后利用<strong>百度智能云情感分析系統(tǒng)</strong>對(duì)商品評(píng)論內(nèi)容進(jìn)行分析,這一步的操作行云流水,十分體現(xiàn)技術(shù),因?yàn)樵趯?shí)際處理中,用戶會(huì)輸入很多表情,這些都屬于異常字符,都需要進(jìn)行過濾,所以老師介紹了try…except…的解決方案,完美避開了表情包的干擾,這樣能使工具能夠順利進(jìn)行,最后計(jì)算出同一產(chǎn)品的中位數(shù),并繪制頻率密度直方圖,這樣就可以更清晰地反映用戶的情感得分分布,對(duì)后續(xù)的商家的運(yùn)營(yíng)策略調(diào)整具有積極性意義。</p> <p style="text-align: justify;"> </p> <p style="text-align: justify;"><span class="h1">05 個(gè)人感受</span></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">我之前一直覺得SQL和Python在實(shí)際工作用到的情況十分少,我本人對(duì)我自己的Excel水平十分自信,覺得Excel應(yīng)該可以處理大部分?jǐn)?shù)據(jù)分析的問題了,Python就是算法和爬蟲工程師需要做的事。但是面對(duì)十分大的數(shù)據(jù)量的時(shí)候,上萬條數(shù)據(jù)的時(shí)候Excel就可以不管用了,可以說是內(nèi)存不夠,Python和SQL則可以改善這些缺點(diǎn),在電腦里相當(dāng)于是建立了一個(gè)虛擬內(nèi)存,處理數(shù)據(jù)起來就會(huì)十分快捷,這也是<strong>Excel無法達(dá)到的高度</strong>,所以<strong>如果以后要吃數(shù)據(jù)分析這口飯,Python和SQL真的能決定這一份職業(yè)的上限。</strong></p> <p style="text-align: justify;"> </p> <p style="text-align: justify;">目前我拿到了南安普頓大學(xué)應(yīng)用統(tǒng)計(jì)專業(yè)的offer,很感謝這個(gè)項(xiàng)目給予我的幫助,也增強(qiáng)了我對(duì)數(shù)據(jù)分析技能的信心,當(dāng)然想要成功,單靠這個(gè)課程是不夠的,還需要自身在日常生活中不斷耕耘,在實(shí)際數(shù)據(jù)分析操作中不斷查缺補(bǔ)漏,老師說的話和這股信念鼓勵(lì)著我一定要一直走下去。</p> <hr /> <p style="text-align: justify;"><img style="width: 750px; height: 3631px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/sucai/content/1655890266471/1655890266472.png" width="750" height="3631" /></p>
猜你喜歡
海外名校1v1科研:基于深度學(xué)習(xí)的中國(guó)租房通脹預(yù)測(cè)|收獲一作論文與導(dǎo)師推薦信!
21446
背景提升學(xué)員|喜報(bào)!新國(guó)立、南洋理工、港大、港城、悉尼大學(xué)、曼大、華威、伊利諾伊香檳分校offer來了!
21483
對(duì)機(jī)器學(xué)習(xí)感興趣?不如先來實(shí)踐一下!|《特斯拉車輛故障自動(dòng)檢測(cè)系統(tǒng)》
21396
曼大范教授1v1科研:溫和條件下CO2催化制甲醇:新型催化劑的研發(fā)|收獲一作論文與導(dǎo)師推薦信!
21393
曼大孫教授1v1-模仿學(xué)習(xí)與機(jī)器人仿真的應(yīng)用研究|收獲一作論文與導(dǎo)師推薦信!
21379
范德堡尹教授1v1-大語言模型在法律領(lǐng)域應(yīng)用研究|收獲一作論文與導(dǎo)師推薦信!
21223
預(yù)約咨詢
預(yù)約咨詢
七日熱點(diǎn)資訊
【日?qǐng)?bào)】9.13熱點(diǎn)速遞:香港大學(xué)申請(qǐng)時(shí)間更新;愛丁堡大學(xué)申請(qǐng)變動(dòng)
【日?qǐng)?bào)】9.14熱點(diǎn)速遞:2025年《衛(wèi)報(bào)》英國(guó)最佳大學(xué)排名發(fā)布;悉尼大學(xué)最新滿位提醒
跟港三正面硬剛,提前三個(gè)月開放申請(qǐng),港城都能和港大、港中文搶人了?
“保底校港理工默拒,我卻收到港三新二offer”,踩著ddl申請(qǐng),211學(xué)姐放棄港大,奔赴南洋理工!
真心勸大家趕緊讀一年碩吧,哪怕水一點(diǎn)也行
【日?qǐng)?bào)】9.16熱點(diǎn)速遞:倫敦政治經(jīng)濟(jì)學(xué)院申請(qǐng)時(shí)間更新;帝國(guó)理工學(xué)院學(xué)位要求變更
微信咨詢
掃一掃立即咨詢
App下載
下載指南者留學(xué)App
在線客服
電話咨詢
400-183-1832
回到頂部
預(yù)約咨詢
登錄
二維碼已過期
重新獲取
已掃碼
等待確認(rèn)登錄
請(qǐng)使用微信掃描二維碼登錄
現(xiàn)在來設(shè)置你的賬號(hào)吧
只需要花不到一分鐘,之后便可以獲得更精準(zhǔn)的推薦~
1
留學(xué)意向
2
基本意向
3
詳細(xì)背景
4
了解途徑
1.1 您期望申請(qǐng)學(xué)歷是
1.2 您期待的留學(xué)地區(qū)是
多選
2.1 您的身份狀態(tài)是
2.2 您的目前學(xué)歷是
3.1 您的本科學(xué)校是
大陸本科
海外本科
3.2 您的學(xué)校名稱是
沒有查詢到相關(guān)的學(xué)校
查詢中...
3.3 您的專業(yè)名稱是
沒有查詢到相關(guān)的專業(yè)
查詢中...
4. 您了解到我們的途徑是
取消
上一步
下一步
復(fù)制
復(fù)制
您的會(huì)員等級(jí)不足,查看等級(jí)詳情
立即前往
選擇收藏夾
新增收藏夾
{{option.remark_name}}
默認(rèn)
{{option.info_count}}條內(nèi)容
取消
完成
新增收藏夾
設(shè)為默認(rèn)收藏夾
返回
{{ form.id ? '完成編輯' : '確定創(chuàng)建' }}
是否放棄編輯內(nèi)容?
取消
確定