Name: | Description: | Size: | Format: | |
---|---|---|---|---|
361.48 KB | Adobe PDF |
Advisor(s)
Abstract(s)
A segmentação do mercado é um tema importante para os administradores das instituições de ensino superior. A segmentação dos alunos permite a diferenciação e a definição de ações personalizadas de acordo com cada segmento e pode ser realizada recorrendo a dados existentes de alunos para serem posteriormente utilizados no desenvolvimento de ações de comunicação ou para realização de um acompanhamento interno diferenciado. A metodologia utilizada para realizarmos a segmentação dos alunos (n=280) recorreu à análise de clusters utilizando o algoritmo k-means disponível na biblioteca scikit. O k-means é um algoritmo não supervisionado para a determinação dos clusters, que requer que o investigador determine à priori o número de clusters pretendidos, utilizando uma aproximação iterativa calculando o centro ótimo de cada cluster. A identificação do número de clusters foi baseada no método elbow, que utiliza o pressuposto de que o número de clusters ótimo é aquele em que adicionando mais clusters não reduz significativamente a variância entre clusters. Depois de obtivermos cada cluster realizamos a sua caraterização utilizando as variáveis existentes para termos uma melhor compreensão dos dados. Os resultados obtidos permitiram identificar três clusters, onde obtivemos no cluster um 89 alunos, cluster dois 16 alunos e cluster três 175 alunos. Para facilitar a compreensão dos resultados obtidos realizamos a redução das variáveis existentes através de do Principal Components Analysis, uma redução de dimensões para podemos projetar os dados num espaço dimensional menor de duas dimensões, num gráfico de dispersão x,y. Realizamos a caraterização (média±desvio padrão) das variáveis idade, ano, estado civil e sexo. Os resultados obtidos evidenciam que nos clusters um, dois e três as médias de idades são aproximadamente iguais 28,29 e 31, o estado civil é maioritariamente solteiros com 80%, 81% e 75% e o sexo feminino representa 49%, 51% e 50% respetivamente. Os resultados conseguidos não são elucidativos considerando os indicadores obtidos em cada cluster. Para podermos retirar melhores conclusões deveriam ser incluídas mais variáveis, como cursos frequentados, resultados obtidos na frequência do curso e aumentar a amostra. Um aspeto que poderia ter sido equacionado seria a normalização dos dados, reduzindo impacto de variáveis em escalas diferentes na determinação do número de clusters. Por último seria interessante explorar as diferenças entre os alunos nos clusters existentes realizando a análise das variáveis existentes.
Description
Keywords
Análise de clusters Alunos ensino superior Segmentação