Centro de Documentação da PJ CD 315 |
PHISHING WEB SITE DETECTION USING DIVERSE MACHINE LEARNING ALGORITHMS Phishing web site detection using diverse machine learning algorithms [Documento electrónico] / Ammara Zamir …[et al.] The Electronic Library, Vol. 38, n.º 1 (2020), p. 65-80 Tradução parcial do resumo inserto no artigo. Ficheiro de 538 KB em formato PDF (16 p.). CRIME VIA INTERNET, CRIME INFORMÁTICO, FRAUDE INFORMÁTICA, TÉCNICA DE INVESTIGAÇÃO CRIMINAL Este artigo tem como objetivo apresentar uma estrutura para detetar sites de phishing usando o modelo de empilhamento. Phishing é um tipo de fraude para aceder às credenciais dos utilizadores. Os invasores acedem a informações pessoais e confidenciais dos utilizadores, para fins monetários. O phishing afeta diversos campos, como comércio eletrónico, negócios online, bancos e marketing digital, e é normalmente realizado através do envio de e-mails de spam e do desenvolvimento de sites semelhantes aos sites originais. Conforme as pessoas navegam no site visado, os phishers sequestram as suas informações e dados pessoais. Os recursos do conjunto de dados de phishing são analisados usando técnicas de seleção de recursos, incluindo ganho de informações, taxa de ganho, Relief-F e eliminação recursiva de recursos (RFE) para seleção de recursos. Duas características são propostas combinando os atributos mais fortes e mais fracos. A análise de componentes principais com diversos algoritmos de aprendizagem de máquina, incluindo floresta aleatória [RF], rede neural [NN], ensacamento, máquina de vetor de suporte, Naïve Bayes e K-nearest Neighbour ou kNN) é aplicada nas características propostas e restantes. Posteriormente, dois modelos de empilhamento: Stacking1 (RF + NN + Bagging) e Stacking2 (kNN + RF + Bagging) são aplicados combinando classificadores de pontuação mais alta para melhorar a precisão da classificação. Os recursos propostos desempenharam um papel importante na melhoria da precisão de todos os classificadores. Os resultados mostram que RFE desempenha um papel importante para remover o recurso menos importante do conjunto de dados. Além disso, Stacking1 (RF + NN + Bagging) superou todos os outros classificadores em termos de precisão de classificação para detetar sites de phishing com 97,4% de precisão. Esta pesquisa é nova a esse respeito, pois nenhuma pesquisa anterior coloca o foco no uso de feed forward NN e ensemble learners para detetar sites de phishing. |
![]() |
![]() |