Занимљиво

Анализа кластера и како се користи у истраживању

Анализа кластера и како се користи у истраживању


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Кластер анализа је статистичка техника која се користи да се утврди како се разне јединице - попут људи, група или друштава - могу груписати због карактеристика које имају заједничке. Такође познато као групирање, то је истраживачко средство за анализу података које има за циљ да разврста различите предмете у групе на такав начин да када припадају истој групи имају максималан степен удруживања и када не припадају истој групи, степен удруживања је минималан. За разлику од неких других статистичких техника, структуре које су откривене кластерском анализом не требају објашњења или интерпретације - она ​​открива структуру података без објашњења зашто постоје.

Шта је кластерирање?

Кластерирање постоји у готово сваком аспекту нашег свакодневног живота. Узмимо, на пример, предмете у трговини. Различите врсте предмета увек се приказују на истим или у близини локација - месо, поврће, сода, житарице, производи од папира итд. Истраживачи често желе то исто да ураде са подацима и групишу предмете или предмете у кластере који имају смисла.

Да узмемо пример из друштвених наука, рецимо да гледамо земље и желимо да их групишемо у кластере на основу карактеристика као што су подела рада, милиције, технологија или образовано становништво. Открили бисмо да Велика Британија, Јапан, Француска, Немачка и Сједињене Државе имају сличне карактеристике и да би биле повезане у групу. Уганда, Никарагва и Пакистан такође би били сврстани у различит скуп зато што имају различит скуп карактеристика, укључујући низак ниво богатства, једноставније поделе рада, релативно нестабилне и недемократске политичке институције и низак технолошки развој.

Кластерска анализа се обично користи у истраживачкој фази истраживања када истраживач нема претходно замишљене хипотезе. То обично није једина употребљена статистичка метода, већ се ради у раним фазама пројекта како би се лакше водио остатак анализе. Из тог разлога, испитивање значајности обично није ни релевантно нити је примерено.

Постоји неколико различитих врста анализа кластера. Два најчешће кориштена су кластерисање К-средстава и хијерархијско групирање.

К-значи кластерирање

К-значи кластерирање посматра опажања у подацима као објекте који имају локације и удаљености једни од других (имајте на уму да растојања која се користе у кластерирању често не представљају просторне удаљености). Објекте дели на К међусобно искључујуће кластере тако да се објекти унутар сваког кластера налазе што ближе једни другима и у исто време, што даље од објеката у другим кластерима. Сваки кластер је тада окарактерисан средњом или средњом тачком.

Хијерархијско кластерирање

Хијерархијско кластерирање је начин да се истовремено истраже груписање података на различитим скали и удаљеностима. То се постиже тако што ствара стабло кластера са различитим нивоима. За разлику од К-значи кластерирања, дрво није један скуп кластера. Уместо тога, дрво је хијерархија на више нивоа где се кластери на једном нивоу спајају као кластери на следећем вишем нивоу. Алгоритам који се користи започиње са сваким случајем или променљивом у засебном кластеру, а затим комбинује кластере све док не остане само један. То омогућава истраживачу да одлучи који је ниво кластерирања најприкладнији за његово истраживање.

Извођење анализе кластера

Већина софтверских програма за статистику може вршити анализу кластера. У СПСС изаберите анализирати из менија, затим класификовати и анализа кластера. У САС-у проц цлустер функција се може користити.

Ажурирао Ницки Лиса Цоле, доктор наука


Погледајте видео: Стоянка охотников и собирателей Лепенски-Вир. Традиции, искусство и датировки перехода к земледелию (Јун 2022).