Садржај
Увод
Кратак увод у Џупитер
Музика
Јавно Здравље
Екологија
Спорт
Говори статистички да те цео свет разуме
Увод у Пајтон на крају курса
Џупитер пушкице
Уместо закључка
Пре него што почнемо¶
Наслову „Пре него што почнемо“ би се имало шта замерити јер смо већ почели. Но, верујте нам: прави почетак тек стиже!
Како да користим овај курс?¶
На ово питање, као и на готово сва друга питања, одговор је „Зависи“. Пре свега, зависи од тога ко сте ви и шта желите да добијете од овог курса. Ми ћемо вам рећи шта овај курс све садржи и како мислимо да је најбоље да се користи, али, у зависности од ваших предзнања и жеља, различити делови курса биће вам различито потребни/занимљиви.
О чему је овај курс?¶
Кроз овај курс желимо да вас научимо како да анализирате податке и из тих анализа извлачите релевантне закључке, а затим и како да своје резултате визуелно представите. Додатни заплет је што хоћемо све то да урадимо алгоритамски, у програмском језику Пајтон, тако да вам наши кoдови могу послужити као основа када кренете у анализу сопствених података. Вештине анализе и визуализације података представили смо кроз четири области - спорт, музика, јавно здравље и екологија. У складу са тиме, и овај курс је издељен на четири целине, које су, затим, представљене кроз изабрана истраживачка питања. Надамо се да ће у оквиру ове четири различите области, сваки читалац и читатељка успети да нађу нешто што их занима.
Којим редоследом да читам?¶
Курс можете да пролазити редом, кренувши од музике и завршивши са спортом и на тај начин ћете сигурно видети све начине анализе и визуелизације података, статистичке методе и програмерске технике које смо за вас припремили. Међутим, потрудили смо се да области учинимо релативно независним, тако да курс можете да читате и другачијим редоследом или да се задржите само на некој од тема релевантних баш за вас. У том случају, може се десити да пропустите нешто од садржаја курса, али, ако сте сигурни да вас не занимају све четири области, а не смета ван што ћете можда пропустити одређени садржај, слободно почните од области која вас највише занима.
Кључни део овог курса представљају и различити статистички алати и појмови које ћемо представити кроз све четири области курса. Јако нам је важно да разумете обраду података да и научите како да закључујете на основу својих анализа, а не само да вам покажемо како раде алати за обраду, због чега смо велики део нашег курса посветили управо томе шта се и када може користити од статистичких алата. Очекујемо да ће одређен број тих појмова бити нов за наше читаоце и читатељке и због тога смо на крај овог курса сместили поглавље Говори статистички да те цео свет разуме у коме смо кључне појмове из материјала подробније објаснили. Кад год наиђете на појам који вам је потпуно нов, а из контекста не успевате да закључите довољно о њему, као што би, рецимо, могли бити аутлајер, стандардна девијација или категоријална варијабла, препоручујемо вам да га потржите у овом поглављу како бисте себи олакшали даље читање.
А Пајтон?¶
Поред статистике и анализе података, знамо да је за велики број читалаца велика новина и Пајтон, који је главни алат у овом курсу. Ако сте и ви један/једна од њих, не брините, то је сасвим у реду. Не мислимо да треба да одустанете од овог курса и одложите његово читање док не савладате све Пајтон материјале на Петљи! Напротив, искористите интересантне приче о подацима које смо припремили да бисте видели како Пајтон може убрзати анализу и долазак до лепих и прегледних визуализација података. Коришћење Пајтона у обради података ослања се на свега неколико кључних библиотека па би чак и неко ко одлично решава алгоритамске задатке у Пајтону био/била запљуснут/запљуснута новим појмовима и алатима. Због тога је препорука за све – наоружајте се стрпљењем за кодове који не раде баш из првог покушаја и завирујте у линкове ка документацији и другим материјалима на Петљи кад год вас нешто збуњује. У том духу, припремили смо и кратке Пајтон и Џупитер пушкице на крају материјала које вам могу помоћи да савладате релевантне елементе овог програмског језика. Ове пушкице могу да служе и као подсетник током читања материјала, па уопште није лоше да их све време држите отвореним у другом прозору док будете читали наредне лекције. Све што је потребно за разумевање закључивања о подацима научићете у ходу, пролазећи кроз сам материјал. Имамо потпуно поверење у вас да ћете се снаћи са свиме што следи и најбољи савет који можемо да вам дамо је да никако не одустајете ако наиђете на неку препреку која вам делује непремостиво. Учење програмирања и коришћење програмерских алата уме да буде фрустрирајуће на почетку. Најважније је да не губите стрпљење и да се често враћате на основне концепте.
На крају, поред Пајтон и Џупитер пушкица и статистичког појмовника, које очекујемо да често проверавате и користите приликом проласка кроз курс, видећете да је курс препун линкова ка спољним садржајима који треба да вам олакшају разумевање шта одређени делови кода, статистичке методе или начини визуелизације раде. Добро је да се одмах навикнете да често проверавате релевантне изворе приликом рада у Џупитеру и Пајтону (као што је рецимо документација разних библиотека и пакета), пошто ћете, чак и када будете много више напредовали на овом пољу, стално чете морати да ггвирите у различите изворе. Не допустите да вас нелинеарна природа овог целог процеса обесхрабри, сви ови садржаји су ту да вам помогну при учењу.
Коришћење курса са техничке стране¶
Овај курс можете читати на нашем сајту и видећете да одређене лекције и задаци имају елементе које је могуће кликнути како бисте дошли до одговора, или визуализације са којима је могуће интераговати.
Иако смо се трудили да читање учинимо интерактивнијим, вештине које покушавамо да вам покажемо много се боље уче кроз покушаје и погрешке него читањем. Због тога вам препоручујемо да преузмете материјале из курса и покренете их на свом рачунару и да самостално испробате све што вам показујемо. Додатно, у верзији за преузимање, коју смо припремили за вас, налазе се и неки задаци и решења која ћете моћи да покренете само на свом рачунару (не и у верзији курса на нашем сајту).
Да бисте све покренули на свом рачунару, потребно је мало припреме.
Прво, препоручујемо да инсталирате Анаконду (дистрибуцију Пајтона прилагођену, између осталог, и обради података). Биће довољно да испратите ово упутство за инсталацију Анаконде, које ће вам показати како да то урадите на Windows оперативном систему (исти су кораци и на другим оперативним системима).
Након тога преузмите овај ZIP фајл и распакујте га било где на рачунару (препоручујемо да то буде фолдер Documents). Ако сте све урадили како треба, ваш фолдер би требало да изгледа овако:
Када сте распаковали фолдер, покрените Anaconda Navigator тако то ћете га пронаћи у стартном менију.
Прозор који ће се отворити треба да изгледа отприлике овако:
Након тога, у менију са леве стране изаберите опцију Environments и у дну стране кликните на Import
У прозору који ће се појавити кликните на иконицу за фолдер у пољу Local drive
Пронађите затим фолдер који сте преузели на почетку (у нашем примеру стављен је у Documents) и у њему одаберите фајл environment.yml и кликните на Open
Након тога кликните на Import и дајте програму мало времена да подеси окружење у коме ћете радити.
Док се то дешава у доњем десном углу ћете моћи да пратите прогрес целог процеса.
Када постављање окружења буде завршено, требало би да добијете ново окружење које се зове BDD_environment и да на десној половини екрана постоји списак пакета који су инсталирани. Ваш прозор би требало да изгледа овако:
Да бисте започели са радом, довољно је да кликнете на зелено дугме поред окружења BDD_environment и то ће у вашем браузеру покренути Џупитер, интерактивно окружење за обраду података. Ако је све како треба, ваш браузер прозор ће изгледати отприлике овако:
Препознаћете да су отворени фолдери са вашег рачунара. Наравно, на различитим рачунарима разликоваће се и структура ових фолдера, па се немојте забринути ако код вас екран не изгледа потпуно исто као на нашој слици. Пронађите фолдер Budi_Data_Driven_files-main који сте преузели раније (у нашем случају налази се у оквиру фолдера Documents). У њему се налазе субфолдери за сваку од области курса у којима су Џупитер свеске (са екстензијом .ipynb), фајлови са којима ћете радити током целог курса.
Коначно, можете отворити фолдер 00_Uvod и у њему свеску 1_radna_sveska.ipynb и започети са радом на курсу.
Када завршите са радом и искључите све отворене програме (браузер и Анаконда навигатор), сваки следећи пут када будете желели да поново покренете Џупитер, биће довољно да покренете Анаконда навигатор и исто ово окружење на начин на који је описан у овом упутству. Слободно се често враћајте на упутство ако нешто заборавите, барем док се не уходате са коришћењем Анаконде.
Шта ако не желим да користим Анаконду?¶
Покретање Џупитера на начин на који смо описали представља само нашу препоруку. Има, наравно и других дистрибуција Пајтона и окружења, као и начина да се Џупитер свеске користе. Ако већ имате инсталиран Пајтон и не желите да инсталирате Анаконду, претпоставићемо да већ имате неког искуства са коришћењем Пајтона и Џупитера. У том случају, биће довољно да у оквиру своје локалне инсталације Пајтона инсталирате пакете које се налазе у фајлу requirements.txt и свеске отворите кроз окружење које вама одговара.