Benzetim verileri üzerinde dağıtılmış hizmet reddi saldırılarının tespiti için bir yaklaşım
Özet
Veri madenciliği, verilerin toplanması, temizlenmesi, işlenmesi, analiz edilmesi ve verilerden yararlı bilgiler elde edilmesi süreçlerinin tamamına verilen isimdir. Bilgisayar endüstrisinde en hızlı büyüyen alanlardan biridir. Bilgisayar biliminde ve istatistikte küçük bir ilgi alanı olarak başlamış ve hızla kendi alanını oluşturmaktadır. Büyük veri kümelerine uygulanabilmesinden dolayı, perakende, üretim, telekomünikasyon, sağlık, sigorta ve ulaşım gibi neredeyse tüm sektörlerde kullanılabilmektedir. Tahmin tabanlı modelleme üzerine yapılan çalışmalar, son zamanlarda artış göstermektedir. Özellikle sağlık, hizmet, bilişim alanında modelleme tabanlı algoritmalar oldukça sık kullanılmaktadır. Bu çalışmada amaçlanan Dağıtılmış Hizmet Reddi saldırılarını tespit etmek için veri madenciliği temelli bir tahmin modeli oluşturmaktır. Bu model saldırıların ilk başladığı anda sisteme vereceği zararı tahmin etmek ve saldırının başarı yüzdesi hakkında tahminde bulunabilmektir. Bu çalışmada gerçek hayat dağıtık hizmet engelleme saldırı senaryoları baz alınarak 500 durum içeren simüle veri üretilmiştir. Veri setinde bulunan bağımsız değişkenler paketlerin yaşama süresi, atak yapılan paket sayısı, düşük ağ performansı durumu, web sitelerine erişimde yavaşlık durumu, ağ bağlantılarında kesilmeler olup olmaması, spam e-postaların sayışında artış olup olmaması, web sitesinin belli bölümlerine erişimin engellenmesi durumudur, bağımlı değişken ise yapılan atağın başarı durumudur. Bu çalışmada sınıflandırma yöntemi olarak literatürde sık kullanılan ve iyi bir performansa sahip Random Forest yöntemi ele alınmıştır. Data mining is the name given to all the processes of collecting, cleaning, processing, analyzing and obtaining useful information from data. It is one of the fastest growing areas in the computer industry. It started as a small field of interest in computer science and statistics and is quickly forming its own field. Because it can be applied to large datasets, it can be used in almost all industries such as retail, manufacturing, telecommunications, healthcare, insurance and transportation. Studies on predictive modeling have been increasing recently. Modeling-based algorithms are used quite frequently, especially in the fields of health, service and informatics. The aim of this study is to create a data mining-based prediction model to detect Distributed Denial of Service attacks. This model is to predict the damage to the system when the attacks first start and to predict the success percentage of the attack. In this study, simulated data containing 500 cases were generated based on real-life distributed denial-of-service attack scenarios. The independent variables in the data set are the lifetime of the packets, the number of packets attacked, low network performance status, slowness in accessing websites, whether there are interruptions in network connections, whether there is an increase in the number of spam e-mails, access to certain parts of the website is blocked, dependent variable is the success of the attack. In this study, Random Forest method, which is frequently used in the literature and has good performance, is discussed as a classification method.
Bağlantı
https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=RsTBl6RWK25OBMIKtIgYYd6M5uv0FkUOxC4aBIHW4rGi9DJhU5LgNY_c4oEaIiBghttps://hdl.handle.net/20.500.12513/5731
Koleksiyonlar
- Tez Koleksiyonu [651]