5. Uluslararası Adli Bilimler ve Hukuk Kongresinde Bildirimizi Sunduk
Ondokuz Mayıs Üniversitesi, Lisansüstü Eğitim Enstitüsü, Veri Bilimi ABD’ de yapmış olduğum 2. Yüksek Lisansıma ait Yargıtay Kararlarının Suç Türlerine Göre Makine Öğrenmesi Yöntemleri İle Sınıflandırılması başlıklı Mezuniyet Projemi, 5. Uluslararası Adli Bilimler ve Hukuk Kongresinde, İstatistik Bölümünden Danışman Hocam Prof.Dr. Yüksel ÖNER ile birlikte sunduk.
Bildiri Özetimiz aşağıda sunulmuştur, Tam Metin olarak dergi yayını beklenmektedir.
ÖZET
Avukatların içtihat ve emsal karar araştırabilmesi için, mahkeme kararlarının herkese açık olması nedeni ile pek çok internet sitesi ve ticari uygulama bulunmaktadır. Bunların bir çoğu, anahtar kelime girişi ve anahtar kelimeyi içeren kararların listelenmesine dayanmaktadır. Bu durumda avukatın araştırmada kullanacağı anahtar kelimeler kendisi için uygun kararlara ulaşmasını sağlamakta ancak içtihat ve emsal kararların çok fazla olması nedeni ile pratikte zaman kazandırıcı bir yöntem olmamaktadır.
Bu noktada avukatların müvekkillerinin haklarını savunmada içtihat ve emsal kararlara mümkün olan en doğru ve en yüksek hızda ulaşma ihtiyaçları proje çalışmasının çözmeyi amaçladığı ana sorun olarak görülmektedir. Bu sorunun çözülebilmesi için içtihat ve emsal kararlar üzerinde makine öğrenmesi yöntemlerinin kullanılarak bir içtihat/emsal karar arama motorunun alt yapısında kullanılabilir bir model geliştirilebileceği değerlendirilmiştir.
Makine öğrenmesi yöntemiyle yapılan metin sınıflandırma çalışmalarında, metinlerin, bilgisayarın anlayabileceği şekle yani sayısal bir hale dönüştürülmesi gerekmektedir. Çalışmada, Facebook tarafından geliştirilen FastText yöntemi kullanılmıştır.
2020 yılına ait Yargıtay Ceza Genel Kurulu tarafından karara bağlanan 531 adet karar metnine ulaşılmış ilgili oldukları suç türlerine göre sınıflandırılmış ve çapraz doğrulama için 3 eğitim ve test grubuna ayrılmıştır.
FastText danışanlı öğrenme yöntemi ile 3 veri seti üzerinde tekrar sayısı (epoch), öğrenme oranı (lr: learning rate) ve kelime büyüklüğü (wordNgrams) parametrelerinin farklı değerleri için tüm kombinasyonlar ayrıca FastText otomatik optimizasyon seçenekleri ile denemeler yapılmış ve ortalama olarak %44,7 kesinlik değerine ulaşılmıştır.
Bir emsal karar arama sisteminde doğru ve yanlış etiketlenmiş kararlardan oluşacağı için, öğrenme oranı doğru etiketlenmiş sonuçların da artacağı, yanlış etiketlenmiş kararların ise azalacağı anlamına gelecektir. Ancak her halükarda, yalnızca anahtar kelimeye bağlı olarak edilen sonuçlarla kıyaslandığında, ilgililik yani istenen suç türüne ait kayıtların toplam sonuçlar içerisindeki miktarı artacağı %44,7 oranı düşük bir oran olmasına rağmen uygulamada fayda sağlayabilecek bir değer olarak düşünülmektedir.
Anahtar Kelimeler: Hukuk, Hukukta Teknoloji, Emsal Karar, Makine Öğrenimi, FastText
ABSTRACT
In order for lawyers to search for legal precedent and case law, there are many websites and commercial applications because court decisions are open to everyone. Many of these are based on keyword entry and listing decisions involving the keyword. In this case, the lawyer can reach the appropriate decisions with the keywords he will use in the research. However, it is not a time-saving method in practice due to the high number of legal precedent and case-law decisions.
At this point, the need for lawyers to reach legal precedent and case-law decisions in the most accurate and fastest way possible in defending the rights of their clients is seen as the main problem that the project aims to solve. To solve this problem, it has been evaluated that a usable model can be developed in the infrastructure of a legal precedent/case law decision search engine by using machine learning methods to case law and precedent decisions.
In the text classification studies made by machine learning method, the texts should be converted into a digital form that the computer can understand. FastText method developed by Facebook was used in the study.
A total of 531 decisions concluded by the Supreme Court Penal General Assembly of the year 2020, were classified according to the types of crime they are related to and those crimes were divided between 3 training and test groups for cross-validation.
With the FastText supervised learning method, experiments were made with all combinations and FastText automatic optimization options for different values of repetitions (epoch), learning rate (lr) and word length (wordNgrams) parameters on 3 data sets, and an average of 44.7% precision was reached.
Since a case-law decision search system will consist of correct and incorrect labeled decisions, the learning rate will mean that correct labeled results will also increase, while incorrect labeled decisions will decrease. However, in any case, when compared to the results based on the keyword alone, the relevance, that is, the number of records belonging to the desired crime type, in the total results will increase, although the rate of 44.7% is low, it is considered to be a value that can be beneficial in practice.
Keywords: Law, Technology in Law, Precedent Decision, Machine Learning, FastText