4 Conclusão

A partir do presente estudo, podemos concluir:

  • os modelos de regressão são ferramentas extramamente versateís e úteis não somente para predição de valores, mas para a explicação do comportanto de uma variável em função de outras;

  • a segunda amostragem na etapa de coleta de dados foi primordial para um melhor ajuste do modelo;

  • a presença de diversos pontos influentes demandou a utilização da técnica de regressão robusta de forma a minimizar os efeitos dos mesmos;

  • no geral, o modelo apresentou um bom ajuste com \(R^2\) = 0.95, porém para predições deve ser utilizado com cautela pois devido ao grau do polinômio na variável nucleos, as predições serão melhores no domínio observado (1 até 32 núcleos).

4.1 Trabalhos futuros

Houve uma mudança de layout do site após a segunda amostragem. O novo layout contém elementos de javascript para renderizar as especificações dos produtos. Os códigos para a obtenção dos dados no site se tornaram obsoletos, contudo, ainda é possível coletar os dados utilizando web scraping utilizando outras técnicas. O preço desses componentes são sensíveis aos novos lançamentos e ao câmbio, por isso, recomendados cautela em agregar novos dados a estes.

Na Figura 4.1 podemos ver que as marcas Intel e AMD estão utlizando estratégias distintas nos processadores mais recentes. A Intel está apostando em processadores com menos núcleos, porém com uma alta frequência, isso pode ser visto, por exemplo, na décima geração das linhas da marca. Enquanto que a AMD está apostando em mais núcleos de processadores com uma menor frequência do que os processadores da Intel. Isso fica claro na linha dos Threadrippers que possuí processadores com mais de 60 núcleos de processamento. Especificamente para essa linha, não encontramos mais que 5 anúncios deles. Devido a seu alto valor, eles são encontrados em grandes sites que não anunciam no market place. Caso tivéssemos observado mais anúncios dessas linhas acreditamos que utilizar a marca do processador como covariável dummy seria suficiente para captar essa diferença de estratégias. Um desenvolvimento futuro deste trabalho seria coleta dados voltada para as linhas mais recentes das marcas. Ou seja, não somente no site que coletamos, mas também em outros grandes sites que não têm anúncios no market place.

Covariáveis do modelo por marca.

Figura 4.1: Covariáveis do modelo por marca.