收獲QS Top 100統(tǒng)計(jì)學(xué)offer,我是如何學(xué)習(xí)數(shù)據(jù)分析技能的?
收藏已取消
收藏成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{!collectStatus ? '收藏' : '已收藏'}}
在線咨詢
收獲QS Top 100統(tǒng)計(jì)學(xué)offer,我是如何學(xué)習(xí)數(shù)據(jù)分析技能的?
收藏已取消
收藏成功
已添加至{{ selectCollectNames.join(',') }}
更改
{{!collectStatus ? '收藏' : '已收藏'}}
指南者留學(xué) Journey 2022年06月22日 閱讀量:1846
<p style="text-align: justify;"><strong>學(xué)員背景</strong><br />F同學(xué)<br /><strong>本科背景</strong><br />廣東財(cái)經(jīng)大學(xué) 應(yīng)用統(tǒng)計(jì)專業(yè)<br />GPA 81.1 雅思7<br />指南者商業(yè)分析項(xiàng)目實(shí)戰(zhàn)學(xué)員<br /><strong>錄取學(xué)校(2022年秋季入學(xué))</strong><br /><a href="http://www.ivjr.cn/majr_51285" target="_blank" rel="noopener"><span style="text-decoration: underline; color: #1890ff;">南安普頓大學(xué)(QS排名78) 應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)</span></a><br /><strong>背提戰(zhàn)績(jī)</strong></p> <p style="text-align: justify;"><img style="width: 371px; height: 521px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/info_imgUrl_phpnyHSzV.jpg" width="371" height="521" /></p> <p style="text-align: justify;">前言:</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">距離項(xiàng)目結(jié)束已經(jīng)過去兩個(gè)月了,當(dāng)時(shí)參加這個(gè)項(xiàng)目的情形還歷歷在目。我是在今年1月初的時(shí)候報(bào)名這個(gè)項(xiàng)目的,其實(shí)當(dāng)時(shí)最擔(dān)心的問題是這個(gè)項(xiàng)目會(huì)不會(huì)很水,因?yàn)榫W(wǎng)絡(luò)上一直詬病于這些項(xiàng)目,但當(dāng)我真正參與到課程中去的時(shí)候,我發(fā)現(xiàn)我的想法是錯(cuò)誤的。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">項(xiàng)目中很多地方對(duì)我影響很大,當(dāng)然我也受益其中,這個(gè)項(xiàng)目強(qiáng)化了我的專業(yè)技能(提前學(xué)習(xí)數(shù)據(jù)分析和挖掘建模方面的技能),豐富了我的實(shí)踐經(jīng)歷,對(duì)我之后拿到研究生offer有直接有力的幫助。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">01 背景與契機(jī)</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">一開始選擇參加指南者的背景提升項(xiàng)目,是因?yàn)橛X得自己的項(xiàng)目經(jīng)歷太少再加上自己是雙非學(xué)校的背景,缺少具體的實(shí)戰(zhàn)經(jīng)驗(yàn),大學(xué)里參加的項(xiàng)目也很少。即使我是應(yīng)用統(tǒng)計(jì)專業(yè),在學(xué)校里學(xué)了R語言和SQL,但是<strong>Python的實(shí)際應(yīng)用一直是我的弱點(diǎn)</strong>,所以基于這個(gè)想法,我想?yún)⒓右粋€(gè)提升個(gè)人編程能力的項(xiàng)目。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">考慮到我后期我想申請(qǐng)港校和英國(guó)商業(yè)分析的方向,擁有相關(guān)的背景經(jīng)歷也是非常有必要的,<strong>國(guó)外的學(xué)校在BA這塊的錄取會(huì)特別注重申請(qǐng)者的數(shù)據(jù)分析和建模能力以及實(shí)踐經(jīng)驗(yàn)</strong>,這些都是我當(dāng)時(shí)比較缺少的幾點(diǎn)吧。包括我直系的師兄師姐和顧問老師也跟我說擁有幾段與碩士項(xiàng)目相似的經(jīng)歷會(huì)大大提高成功的概率,因?yàn)槟荏w現(xiàn)出自身與項(xiàng)目的匹配度。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">同時(shí)我未來的就業(yè)方向也是想往數(shù)據(jù)分析和商業(yè)分析這兩個(gè)方向,所以提前了解這個(gè)領(lǐng)域所必備的技能對(duì)以后就業(yè)或找實(shí)習(xí)都會(huì)有一定的好處?;谶@幾點(diǎn),我決定參加這個(gè)項(xiàng)目提升自己的背景與能力,最終收獲滿滿。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">02 項(xiàng)目介紹</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">我參加的這個(gè)項(xiàng)目的名字叫做基于電商大數(shù)據(jù)零食市場(chǎng)的分析,這個(gè)項(xiàng)目主要是收集各類淘寶村的店鋪數(shù)據(jù)和商品價(jià)格、銷量和人氣等數(shù)據(jù),以可視化和挖掘建模的方式解讀農(nóng)村淘寶的經(jīng)濟(jì)特征,從商品特色、品質(zhì)和口碑等方面,共同探究淘寶村如何實(shí)現(xiàn)興農(nóng)扶貧的目標(biāo)。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">本次項(xiàng)目的授課老師&mdash;&mdash;王老師,他在bilibili平臺(tái)的Tableau可視化視頻幾年來穩(wěn)居第一,而且他本人也曾經(jīng)在世界知名的咨詢公司工作過很多年,能夠真正給到我一些很實(shí)用的建議,所以個(gè)人覺得同學(xué)們完全可以大膽去報(bào)名這個(gè)項(xiàng)目。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">關(guān)于學(xué)習(xí)的內(nèi)容,總共分為六大節(jié),上課所用到主要是以<strong>SQL、Python</strong>這兩大軟件為主,包括SQL的增刪改查、Python與numpy基礎(chǔ)、pandas、多分類問題、語義情感分析、預(yù)測(cè)與相關(guān)因素分析,最牛的莫過于是利用百度智能云進(jìn)行語句情感得分分析,直接調(diào)用一段代碼就可以了,大大減少了代碼的書寫時(shí)間提高了效率,關(guān)鍵<strong>這是我從來沒有在學(xué)校的一門課程里接觸到類似的知識(shí)</strong>,我認(rèn)為這也是項(xiàng)目中的一個(gè)亮點(diǎn)之一,緊跟現(xiàn)在人工智能的一個(gè)潮流。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">03 準(zhǔn)備過程</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">即使我是學(xué)統(tǒng)計(jì)專業(yè),但在實(shí)際的操作中也會(huì)遇到不少&ldquo;困難&rdquo;,有一些是十分低級(jí)的錯(cuò)誤,比如使用jupyter notebook的時(shí)候把小窗口直接關(guān)掉,導(dǎo)致了程序無法正常運(yùn)行,但是王老師還是十分耐心地告訴我一些需要注意的地方。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">這個(gè)項(xiàng)目里需要每周一次作業(yè),來檢查同學(xué)們的聽課情況,因?yàn)楫?dāng)時(shí)在寫畢業(yè)設(shè)計(jì),時(shí)間分配和把控上做得不是很好,沒怎么認(rèn)真聽課。所以想一次性利用課程的課件把作業(yè)完成好然后交給老師,但是沒想到當(dāng)中遇到不少問題,在群上詢問老師意見,一下子就被老師發(fā)現(xiàn)了,老師很嚴(yán)厲地批評(píng)了我,并語重心長(zhǎng)地對(duì)我說:<strong>編程是需要時(shí)間去練習(xí)的</strong>。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">從那時(shí)開始,我每周的課都聽三遍,并將代碼自己再運(yùn)行一遍,務(wù)必讓自己每一個(gè)知識(shí)點(diǎn)都掌握好,這樣操作下來感覺就沒有特別大的問題了,因?yàn)楹芏嚯y點(diǎn)都是老師所設(shè)計(jì)好的,相信自己一定是可以掌握的,還有給我的啟示就是日常需要有目的性地去練習(xí)編程,提高個(gè)人的編程能力,比如在牛客網(wǎng)、leetcode上多刷題,這些才是<strong>真正為以后就讀研究生甚至是就業(yè)做好充分的準(zhǔn)備</strong>。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">04 項(xiàng)目實(shí)戰(zhàn)</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">經(jīng)過一個(gè)多月的學(xué)習(xí)之后,我對(duì)Python和SQL已經(jīng)掌握得差不多了,在課程的最后就是需要進(jìn)行項(xiàng)目實(shí)操。個(gè)人猜測(cè),老師應(yīng)該運(yùn)用了web scraper插件在天貓上爬取了近3000多條數(shù)據(jù)以及商品的評(píng)論區(qū)的數(shù)據(jù),我們參加項(xiàng)目的同學(xué)進(jìn)行后續(xù)的操作。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">首先基本操作,先導(dǎo)入numpy和pandas包,然后對(duì)excel表格里的數(shù)據(jù)進(jìn)行處理,因?yàn)檎G闆r下獲取的數(shù)據(jù)都是會(huì)有異常值與缺失值,所以我依照老師在課程上講過的處理方法,利用pandas庫對(duì)二維數(shù)據(jù)表對(duì)空白值去除填充,并且定義新函數(shù)對(duì)發(fā)貨地址的省份與城市實(shí)現(xiàn)Excel中的分列功能,最后運(yùn)用數(shù)組與集合等知識(shí)來對(duì)列中不規(guī)則的信息有效提取出來,以獲得商品的具體分類。在這個(gè)過程中,老師還經(jīng)常提醒我們要定期對(duì)表內(nèi)的信息進(jìn)行檢查,不然會(huì)影響到后續(xù)的操作。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">這個(gè)項(xiàng)目中最精彩的部分估計(jì)就是<strong>Tableau</strong>部分了,做出很多意義的圖表,但我一開始沒有什么方向,十分著急,不知道怎么辦好。后面老師給出不同的方向,發(fā)貨地址、店鋪銷量分析、單品分析,并且利用詞云wordart 做出評(píng)論區(qū)頻次最高的詞匯,消費(fèi)者對(duì)產(chǎn)品的態(tài)度一目了然。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">當(dāng)然這些僅僅停留在描述統(tǒng)計(jì)的范疇里面,是經(jīng)不起考驗(yàn)的。后面我們需要借助統(tǒng)計(jì)模型建立多元線性回歸模型和PCA模型,利用相關(guān)理論進(jìn)行必要的降維,導(dǎo)入seaborn和matplotlib包最后繪制出熱力圖,不同變量之間的相關(guān)性通過顏色的深淺就可以看出。最后利用<strong>百度智能云情感分析系統(tǒng)</strong>對(duì)商品評(píng)論內(nèi)容進(jìn)行分析,這一步的操作行云流水,十分體現(xiàn)技術(shù),因?yàn)樵趯?shí)際處理中,用戶會(huì)輸入很多表情,這些都屬于異常字符,都需要進(jìn)行過濾,所以老師介紹了try&hellip;except&hellip;的解決方案,完美避開了表情包的干擾,這樣能使工具能夠順利進(jìn)行,最后計(jì)算出同一產(chǎn)品的中位數(shù),并繪制頻率密度直方圖,這樣就可以更清晰地反映用戶的情感得分分布,對(duì)后續(xù)的商家的運(yùn)營(yíng)策略調(diào)整具有積極性意義。</p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;"><span class="h1">05 個(gè)人感受</span></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">我之前一直覺得SQL和Python在實(shí)際工作用到的情況十分少,我本人對(duì)我自己的Excel水平十分自信,覺得Excel應(yīng)該可以處理大部分?jǐn)?shù)據(jù)分析的問題了,Python就是算法和爬蟲工程師需要做的事。但是面對(duì)十分大的數(shù)據(jù)量的時(shí)候,上萬條數(shù)據(jù)的時(shí)候Excel就可以不管用了,可以說是內(nèi)存不夠,Python和SQL則可以改善這些缺點(diǎn),在電腦里相當(dāng)于是建立了一個(gè)虛擬內(nèi)存,處理數(shù)據(jù)起來就會(huì)十分快捷,這也是<strong>Excel無法達(dá)到的高度</strong>,所以<strong>如果以后要吃數(shù)據(jù)分析這口飯,Python和SQL真的能決定這一份職業(yè)的上限。</strong></p> <p style="text-align: justify;">&nbsp;</p> <p style="text-align: justify;">目前我拿到了南安普頓大學(xué)應(yīng)用統(tǒng)計(jì)專業(yè)的offer,很感謝這個(gè)項(xiàng)目給予我的幫助,也增強(qiáng)了我對(duì)數(shù)據(jù)分析技能的信心,當(dāng)然想要成功,單靠這個(gè)課程是不夠的,還需要自身在日常生活中不斷耕耘,在實(shí)際數(shù)據(jù)分析操作中不斷查缺補(bǔ)漏,老師說的話和這股信念鼓勵(lì)著我一定要一直走下去。</p> <hr /> <p style="text-align: justify;"><img style="width: 750px; height: 3631px; margin-left: auto; margin-right: auto; float: none;" src="https://info.compassedu.hk/sucai/content/1655890266471/1655890266472.png" width="750" height="3631" /></p>
猜你喜歡
預(yù)約咨詢
預(yù)約咨詢
微信咨詢
掃一掃立即咨詢
App下載
下載指南者留學(xué)App
在線客服
電話咨詢
400-183-1832
回到頂部
預(yù)約咨詢
現(xiàn)在來設(shè)置你的賬號(hào)吧
只需要花不到一分鐘,之后便可以獲得更精準(zhǔn)的推薦~
1
留學(xué)意向
2
基本意向
3
詳細(xì)背景
4
了解途徑
1.1 您期望申請(qǐng)學(xué)歷是
1.2 您期待的留學(xué)地區(qū)是多選
2.1 您的身份狀態(tài)是
2.2 您的目前學(xué)歷是
3.1 您的本科學(xué)校是
大陸本科
海外本科
3.2 您的學(xué)校名稱是
沒有查詢到相關(guān)的學(xué)校
查詢中...
3.3 您的專業(yè)名稱是
沒有查詢到相關(guān)的專業(yè)
查詢中...
4. 您了解到我們的途徑是
取消
您的會(huì)員等級(jí)不足,查看等級(jí)詳情
立即前往
選擇收藏夾
新增收藏夾
{{option.remark_name}}
默認(rèn)
{{option.info_count}}條內(nèi)容
取消
完成
新增收藏夾
設(shè)為默認(rèn)收藏夾
返回
{{ form.id ? '完成編輯' : '確定創(chuàng)建' }}
是否放棄編輯內(nèi)容?
取消
確定