Major Components Analysis Software

Schrijver: Lewis Jackson
Datum Van Creatie: 13 Kunnen 2021
Updatedatum: 14 Kunnen 2024
Anonim
Top 10 Data Analysis Tools | Top Data Analytics tools | Data Analytics | Simplilearn
Video: Top 10 Data Analysis Tools | Top Data Analytics tools | Data Analytics | Simplilearn

Inhoud

De analyse van de hoofdcomponenten vermindert een reeks variabelen die is gecorreleerd aan een kleinere set niet-gecorreleerde variabelen, waardoor een complexe gegevensset voor latere analyse wordt vereenvoudigd. Deze complexe statistische procedure kan worden uitgevoerd door veel programma's van data-analyse, of add-on-programma's die de mogelijkheden van hetzelfde uitbreiden, het toevoegen van nieuwe functies.


Spreadsheetprogramma's zoals Excel kunnen belangrijke componentanalyses uitvoeren met behulp van een extensie (Afbeelding door Flickr.com, met dank aan Casey Serin)

Een dataset vereenvoudigen

De analyse van de belangrijkste componenten is een techniek van onderzoek en reductie van gegevens. Een analist kan de techniek gebruiken om relevante informatie uit een grote en verwarrende reeks gegevens te extraheren. De techniek wordt vaak gebruikt wanneer het aantal waargenomen variabelen erg groot is en de correlaties daartussen de gegevens moeilijk direct te analyseren maken. In sommige gevallen kan de correlatie tussen de variabelen bijvoorbeeld een verkeerde indruk wekken van gegevensredundantie, waardoor technische analyse moeilijker wordt of de evaluatie van de gegevens in gevaar komt. De analyse van de hoofdcomponenten vereenvoudigt de variabelen waarmee ze worden uitgedrukt als een functie van een kleiner aantal elementen, de hoofdcomponenten, die de meerderheid van de variaties in de metingen van de gegevens vertegenwoordigen.


Gebruik in het programma

De complexiteit van het analyseren van de belangrijkste componenten vereist het gebruik van een specifiek programma. Er is een grote verscheidenheid aan statistische programma's en de meesten van hen zijn in staat om deze techniek uit te voeren. De meest populaire programma's zijn SAS, Stata en SPSS. Universiteiten, onderzoekscentra, adviesorganisaties en andere onderzoeksprofessionals gebruiken deze specifieke programma's. Alle drie kunnen belangrijke componentanalyse uitvoeren van een dataset die is ingevoegd in een werkblad, waarbij de rijen de afzonderlijke waarnemingen voorstellen en de kolommen de afzonderlijke variabelen vertegenwoordigen.

karakter

De meeste belangrijke softwareprogramma's voor componentanalyses, waaronder SAS, Stata en SPSS, presenteren de resultaten in de vorm van tabellen met de eigenwaarden of variatiemetingen die worden toegelicht. Veel programma's bieden ook de visuele weergave van resultaten in de vorm van een scree-plot.


overwegingen

De analyse van hoofdcomponenten wordt vaak verward met factoriële analyse, een andere techniek voor datareductie die gecorreleerde observaties in termen van onderliggende factoren verklaart. De twee zijn eigenlijk afzonderlijke procedures, hoewel de belangrijkste componentanalyse een stap is van factoranalyse. In veel pakketten worden de twee procedures gecombineerd.

Een andere belangrijke overweging is dat gespecialiseerde programma's zoals SAS, SPSS en Stata duur zijn. Daarom zijn deze programma's mogelijk niet nuttig voor mensen die niet van plan zijn vaak statistische analyses uit te voeren.

uitmunten

Mensen die wat statistische analyse moeten uitvoeren, maar liever geen gespecialiseerd programma kopen, kunnen zich afvragen of veelgebruikte spreadsheetprogramma's, zoals Excel, in staat zijn om een ​​analyse van hoofdcomponenten uit te voeren. Het antwoord is ja en nee. Hoewel Excel beschikt over enkele gegevensanalysetools die mogelijk toegankelijk zijn via de installatie van een pakket statistische analyse, is het programma niet bedoeld als een statistisch analyseprogramma. Belangrijkste componentanalyse en factoranalyse behoren niet tot de functies van de data-analysetool.

Preventie / oplossing

Er is een programma dat gebruikers kunnen downloaden en installeren om de functies van Excel te verbeteren als een hulpmiddel voor gegevensanalyse. Addinsoft, een softwarebedrijf dat gespecialiseerd is in analyseprogramma's, heeft XLSTAT gemaakt. Met dit programma kan Excel belangrijke componentanalyses en andere statistische procedures uitvoeren. Het heeft ook gebruiksvriendelijke procedures, waardoor de gebruiker de gegevens voor analyse kan selecteren door simpelweg op een cel te klikken en deze door de vereiste velden te slepen. Gebruikers kunnen XLSTAT kopen en downloaden via de Addinsoft-website. Er is ook een gratis versie die gebruikers kunnen proberen voordat ze besluiten om het te kopen.