PEMBANGUNAN TEKNIK DALAM MERINGKASKAN TEKS DALAM BAHASA MELAYU. Mohamed Razin bin Mohd Firoz. Prof Dr. Shahrul Azman bin Mohd Noah

Similar documents
COMPUTER AIDED APPROACH FOR OCCUPATIONALLY HEALTHIER CHEMICAL PROCESSES ASSESSMENT AND SELECTION SANTHA PANDIAN UNIVERSITI TEKNOLOGI MALAYSIA

SISTEM PERKHIDMATAN PENGHANTARAN SEGERA (ZuppDelivery) Mohamad Azamuddin bin Embong Dr Noor Hasrina binti Bakar

AN IMPROVED ACCURACY OF WEB SERVICE SELECTION BASED ON MULTI-CRITERIA DECISION MAKING AND WEB SERVICE MODELING ONTOLOGY

IMPLEMENTATION OF GENETIC ALGORITHM IN MODEL IDENTIFICATION OF BOX-JENKINS METHODOLOGY MOHD ZULARIFFIN MD MAAROF UNIVERSITI TEKNOLOGI MALAYSIA

FREQUENCY ESTIMATOR USING ARTIFICIAL NEURAL NETWORK FOR ELECTRICAL POWER SYSTEM DYNAMICS AZLIZA BINTI MOHD JELANI UNIVERSITI TEKNOLOGI MALAYSIA

STRATEGI MENINGKATKAN PENGGUNAAN KONKRIT PRATUANG DI MALAYSIA WAN HANANI BINTI WAN HASSAN

PERLOMBONGAN BERITA BERKAITAN JENAYAH SIBER DARI WEB. Nur Alyya Izzati binti Shaharul Azhar Dr. Wan Fariza

HOUMAN OMIDI. A project report submitted in partial fulfilment of the. Master of Engineering (Electrical-Power) Faculty of Electrical Engineering

AFFINE-BASED TIME-SCALE ULTRA WIDEBAND WIRELESS CHANNEL SIMULATOR FOR TIME-VARYING COMMUNICATION ENVIRONMENT NOR ASWANI BINTI HJ MAMAT

ENERGY ANALYSIS AND OPTIMIZATION OF PUBLIC BUILDING USING BUILDING INFORMATION MODELING APPLICATION

MODIFIED STEREO VISION METHOD FOR AN UNMANNED GROUND VEHICLE MASOUD SAMADI UNIVERSITI TEKNOLOGI MALAYSIA

PELERAIAN SUPER IMEJ MENGGUNAKAN RANGKAIAN NEURAL KONVOLUSI PELERAIAN SUPER JACYLN WANG LING KOK VEN JYN

A MALAY LANGUAGE-BASED VISUAL PROGRAMMING ENVIRONMENT FOR PERSONAL DIGITAL ASSISTANT

PUMP SCHEDULING OPTIMIZATION FOR WATER SUPPLY SYSTEM USING ADAPTIVE WEIGHTED SUM GENETIC ALGORITHM FOLORUNSO TALIHA ABIODUN

ADOPTION OF COMPUTERIZED ACCOUNTING INFORMATION SYSTEM (CAIS) AMONG MALAYSIAN SMEs

COMPARATIVE STUDY OF REGTANGULAR MICROSTRIP PATCH ANTENNA ARRAY DESIGN ABDULLAHI MOALLIM YUSUF

UNIVERSITI SAINS MALAYSIA. CPT344 Computer Vision & Image Processing [Penglihatan Komputer & Pemprosesan Imej]

SYSTEM IDENTIFICATION AND INTELLIGENT CONTROL OF AUTOMOTIVE AIR CONDITIONING SYSTEM. MOHD FIRDAUS BIN MOHAMED

KORELASI. Standard Technical Manual. Rekod Pindaan / Semakan. Pindaan 1 : Pindaan pada pengenalan. Pindaan pada tatacara no

ELECTROMAGNETIC TOMOGRAPHY FOR 2-D LIM MENG CHUN

PENGECAMAN BAHASA ASAL MENGGUNAKAN TEKNIK PEMBELAJARAN MESIN. Ng Kar Lun Dr. Wan Fariza Fauzi

DEVELOPMENT OF A MODULAR PHOTOVOLTAIC MAXIMUM POWER POINT TRACKING CONVERTER PANG TUCK SENG

DUAL BAND ANTENNA FOR RADIO FREQUENCY IDENTIFICATION APPLICATIONS MURSYIDUL IDZAM SABRAN. requirement for award of the degree of

UNIVERSITI TEKNOLOGI MALAYSIA

ANALYSIS OF MARINE INCIDENTS IN MALAYSIA SURHAN JAMIL BIN HARON

CARBON NANOTUBE FIELD-EFFECT TRANSISTOR FOR A LOW NOISE AMPLIFIER NGU KEK SIANG UNIVERSITI TEKNOLOGI MALAYSIA

INSTRUCTION: This section consists of FOUR (4) structured questions. Answer ALL questions.

UNIVERSITI PUTRA MALAYSIA SIMULATED REAL TIME CONTROLLER FOR TUNING ALGORITHM USING MODIFIED HILL CLIMBING APPROACH AHMED ABDULELAH AHMED

INTERFERENCE BETWEEN TERRESTRIAL, HIGH-ALTITUDE PLATFORM AND SATELLITE SYSTEMS AT 28 GHz KHALID IBRAHIM ALKHEDHAIRI UNIVERSITI TEKNOLOGI MALAYSIA

A GRAY-SCALE IMAGE STEGANOGRAPHY TECHNIQUE USING FIBONACCI 12-BITPLANE DECOMPOSITION AND LSB APPROACH SABAH FADHEL HAMOOD

Pengelasan Personaliti Individu Polis DiRaja Malaysia (PDRM) Menggunakan Rangkaian Neural Buatan dan Analisis Komponen Utama

ADAPTIVE CROSS WIGNER-VILLE DISTRIBUTION FOR PARAMETER ESTIMATION OF DIGITALLY MODULATED SIGNALS CHEE YEN MEI

THERMAL ANALYSIS OF H.V INSULATION OIL DURING PARTIAL DISCHARGE DETECTION RASOOL ABDELFADIL GATEA UNIVERSITI TEKNOLOGI MALAYSIA

NON-LINEAR WATER LEVEL FORECASTING OF DUNGUN RIVER USING HYBRIDIZATION OF BACKPROPAGATION NEURAL NETWORK AND GENETIC ALGORITHM SITI HAJAR BINTI ARBAIN

INTEGRATING COOPERATIVE USERS TO DEVELOP FRAMEWORK FOR AN EFFECTIVE MOBILE PHYSIOTHERAPY YOUCEF BENFERDIA

PENJEJAKKAN IMEJ WEB (SPY X) Faeqa Adilah Binti Mohd Anuar Dr Wan Fariza Binti Paizi

PENGECAMAN PERTUTURAN DALAM ROBOT PERKHIDMATAN. Kong Yee Teng Assoc. Prof. Dr. Shahnorbanun Sahran

OPTIMAL PROPORTIONAL INTEGRAL DERIVATIVE CONTROLLER FOR AUTOMATIC VOLTAGE REGULATOR SYSTEM USING PARTICLE SWARM OPTIMIZATION ALGORITHM

CG605: UTILITY MAPPING

SILICON NANOWIRE FIELD-EFFECT TRANSISTOR (SINWFET) AND ITS CIRCUIT LEVEL PERFORMANCE SITI NORAZLIN BINTI BAHADOR UNIVERSITI TEKNOLOGI MALAYSIA

MODEL DEVELOPMENT OF ESTIMATING OIL DISCHARGE FOR SUSTAINABLE GREEN PORT NAJLAA NAZIHAH BINTI MAS OOD UNIVERSITI TEKNOLOGI MALAYSIA

IMPROVING THE DOCUMENTATION OF USER S REQUIREMENTS FOR E-SERVICE SYSTEMS USING SERVICE RESPONSIBILITY TABLE IBRAHIM SALIHU ANKA

DEVELOPMENT OF DYNAMIC EQUIVALENTS FOR INTERCONNECTED POWER SYSTEMS USING IDENTIFICATION APPROACHES KOK BOON CHING UNIVERSITI TEKNOLOGI MALAYSIA

PWM PIC16F877A DIMMING ELECTRONIC BALLAST FOR HPS LAMP NATRA BINTI ISMAIL

EVALUATION OF VARIOUS MILLING STRATEGIES IN SUPPORTING ADVANCED CAD/CAM ENVIRONMENT FOR BIOMEDICAL APPLICATIONS

EFFECTIVE AEROSOL OPTICAL THICKNESS RETRIEVAL ALGORITHM USING MODIS 500 METRE DATA AHMAD MUBIN BIN WAHAB UNIVERSITI TEKNOLOGI MALAYSIA

CONFIGURATION DESIGN MOHD FAHRUL BIN HASSAN

HIGH-PERFORMANCE DIGITAL FILTER IN FPGA SITI SUHAILA MOHD YUSOF UNIVERSITI TEKNOLOGI MALAYSIA

EEE 270 Elektronik Analog II

SELECTION OF THE INDUSTRILIZED BUILDING MATERIAL SUPPLIER BY ANALYTIC HIERARCHY PROCESS METHOD MOHAMMAD YOUSEF MORAVVEJI

INSTRUCTION: This section consists of TWO (2) structured questions. Answer ALL questions.

A HIGH SPEED 2D CONVOLUTION HARDWARE MODULE FOR IMAGE PROCESSING APPLICATIONS IN FPGA BEENAL BABA UNIVERSITI TEKNOLOGI MALAYSIA

DYNAMIC ANALYSIS OF AIRCRAFT LANDING GEAR SADEGH IMANI YENGEJEH

DETERMINATION OF LEAKAGE IN AN OIL AND GAS PIPELINE NOR AZIAN BINTI MOHIDEEN ABDUL KADIR

UNIVERSITI SAINS MALAYSIA Peperiksaan Semester Pertama Sidang Akademik 2003/2004

JPEG IMAGE TAMPERING DETECTION BASED ON BLOCKING ARTIFACTS ALI EBRAHIMI

GRAPHICS PROCESSING UNIT BASED PARALLEL COPY MOVE IMAGE FORGERY DETECTION SCHEME AHMAD UWAYS BIN ZULKURNAIN

PEMBANGUNAN SISTEM EZCLINIC

CONTINUOUS INDIVIDUAL PLOT CURVES TECHNIQUE FOR SIMULTANEOUS TARGETING AND DESIGN OF A MASS EXCHANGE NETWORK YANWARIZAL UNIVERSITI TEKNOLOGI MALAYSIA

DESIGN OF POWER GENERATION SYSTEM BASED ON BUOYANCY AND GRAVITY AMIRUDDIN BIN MOHD TAJUDIN. A thesis submitted in fulfilment of the

ANTENNA ARRAY (DESIGN AT 28 GHz FOR 5G MOBILE NETWORK BASIL JABIR SHANSHOOL. A project submitted in partial fulfilment of the

UNIVERSITI SAINS MALAYSIA EEE 344 SISTEM VLSI

HARMONIC MODELING IN POWER DISTRIBUTION SYSTEM USING TIME SERIES SIMULATION CHE KU FARHANA BINTI CHE KU AMRAN UNIVERSITI TEKNOLOGI MALAYSIA

PATTERN AND FREQUENCY RECONFIGURABLE ANTENNA FOR WIRELESS APPLICATIONS DELPHINE ABIJURU. requirements for the award of the degree of

INTEGRATED SYSTEM OF AUTOMATIC IDENTIFICATION SYSTEM (AIS) AND RADAR FOR PORT TRAFFIC MANAGEMENT NUR AIREEN BT. AMRAN UNIVERSITI TEKNOLOGI MALAYSIA

PRODUCT DESIGN IMPROVEMENT USING DESIGN FOR MANUFACTURE AND ASSEMBLY (DFMA) METHODOLOGY

AN IMPROVED METHOD FOR UNIVERSITY BUILDING S ENERGY EFFICIENCY INDEX USING CLUSTER APPROACH NUR NAJIHAH BINTI ABU BAKAR UNIVERSITI TEKNOLOGI MALAYSIA

INSTRUCTION: This section consists of TEN (10) structured questions. Answer ALL questions.

APLIKASI WARISAN SONGKET MENGGUNAKAN AUGMENTASI REALITI MUDAH ALIH: SMARTSONGKET. Nurlieda Ellyanna Munirrah Binti Razali Nazatul Aini Abd Majid

SLIDING MODE CONTROL FOR DC-AC CONVERTER POUYA IZADIFAR

MESOPYME-IEMA SOFTWARE PROCESS EVALUATION MODEL FOR SMALL AND MEDIUM SOFTWARE INDUSTRIES IMRAN BASHA

TRIPLE-BAND DIPOLE ANTENNA WITH ARTIFICIAL MAGNETIC CONDUCTOR FOR RADIO FREQUENCY IDENTIFICATION MAISARAH BINTI ABU UNIVERSITI TEKNOLOGI MALAYSIA

A BIOMETRIC ENCRYPTION SYSTEM ALGORITHM DEVELOPMENT AND SYSTEM LEVEL DESIGN RABIA BAKHTERI UNIVERSITI TEKNOLOGI MALAYSIA

MULTIBAND TEXTILE ANTENNA FOR WEARABLE APPLICATION MOHD EZWAN BIN JALIL

KISAH KEJAYAAN USAHAWAN DI MINI PI1M KEMAMAN COMMAND CENTRE

EEE 241 ELEKTRONIK ANALOG I

3 AN EXPLORATORY STUDY UNIVERSITY TEKNOLOGI MALAYSIA S INNOVATION TOWARD COMMERCIALIZATION BAWER MARWAN ABDULAHAD

ADAPTIVE CHANNEL ESTIMATION FOR SPARSE ULTRA WIDEBAND SYSTEMS SOLOMON NUNOO UNIVERSITI TEKNOLOGI MALAYSIA

UKMEALS: SISTEM PESANAN MAKANAN MUDAH ALIH. Sim Wei Jie Haslina Arshad. Fakulti Teknologi & Sains Maklumat, Universiti Kebangsaan Malaysia

MANAGING CONTRUCTION DISPUTES CALEB DUMISA MOTSA

ULTRA WIDEBAND ANTENNA WITH BAND NOTCH AT 5.8 GIGAHERTZ USING CONDUCTIVE SILVER COATED THIN FILM MOHD SUBRI BIN ABDUL RANI

AN AUTOMATIC POURING MACHINE ADNAN BIN AHMAD

MODELING OF IMAGE PROCESSING ALGORITHMS FOR HARDWARE-SOFTWARE CO-SIMULATION IBRAHIM ISA UNIVERSITI TEKNOLOGI MALAYSIA

DEVELOPMENT OF AN AUTOMATED SELECTION SYSTEM FOR CUTTING TOOLS AND MACHINING PARAMETERS OF MILLING OPERATIONS

SISTEM PENGLIHATAN ROBOT BOLA SEPAK MANUSIA LAWAN KECERDASAN BUATAN ATAS PLATFORM MUDAH ALIH. Mohamad Syazwan bin Shafei Dr. Abdul Hadi bin Abd Rahman

APLIKASI GELANG SIFIR DALAM KONSEP PENDARABAN. Patini Linang anak Michael Dr Ruzzakiah bt Jenal

SYSTEM IDENTIFICATION AND POSITION CONTROL OF PNEUMATIC ACTUATOR USING EMBEDDED SYSTEM TAHA MOHAMMED AHMED SADEQ

INSTRUCTION: This section consists of TWO (2) essay questions. Answer ALL questions.

Implementation of Integrated Project Delivery (IPD) and Building Information Modelling (BIM) In the Construction Industry.

EEK ELEKTRONIK KUASA LANJUTAN

STUDY ON STABILITY OF REFLECTANCE CHARACTERISTICS OF NATURAL FEATURES FOR CALIBRATING REMOTE SENSING DATA

THE MEDIATION EFFECT OF VALUE ON EXPERIENCE AND SERVICE QUALITY TOWARD SATISFACTION IN MALAYSIAN TOURISM INDUSTRY KWOK SEE YING

: NORHAZILINA BT BAHARI

OBJECT CLASSIFICATION USING DEEP LEARNING FONG SOON FEI

LIFE CYCLE ASSESSMENT OF GLOBAL WARMING POTENTIAL IN PRECAST BUILDING COMPONENT WAN ZULIYANA BINTI W ZULKIFFLE

Signature. Supervisor :.. ~.~H-.~.~0~P..?.j.~H~~~.. ~.~.~ Date :...?./!!./~~ ~

STUDY ON THE CHARACTERISTICS OF CAPILLARY PLASMA ANTENNA ARRAY IN RADIO WAVE NOOR FADHILAH BINTI RAMLI

INSTRUCTION: This section consists of FOUR (4) structured questions. Answer ALL questions.

This item is protected by original copyright

UNIVERSITI PUTRA MALAYSIA NOVEL MONOPOLE ANTENNA TECHNIQUE FOR DETERMINATION OF MOISTURE CONTENT IN HEVEA RUBBER LATEX

Transcription:

PTA-FTSM-2018-101 PEMBANGUNAN TEKNIK DALAM MERINGKASKAN TEKS DALAM BAHASA MELAYU. Mohamed Razin bin Mohd Firoz Prof Dr. Shahrul Azman bin Mohd Noah Fakulti Teknologi & Sains Maklumat, Universiti Kebangsaan Malaysia ABSTRAK snippet ialah kepingan kecil atau guntingan ayat atau ringkasan teks. Ringkasan teks memudahkan proses memahami teks yang ditulis. Pemahaman teks boleh dikenalpasti melalui pengecaman kata kunci atau perkataan yang paling banyak digunakan di dalam sebuah teks. Ringkasan teks Bahasa Melayu yang dibangunkan merupakan peringkasan jenis ekstraktif yang akan membantu meringkaskan sesebuah petikan atau teks. Penentuan kata kunci bagi dokumen sangat penting untuk menghasilkan ringkasan. Kata kunci mungkin berada di bahagian awalan, pertengahan dan akhiran perenggan. Dengan adanya ringkasan teks ini, teks atau petikan yang panjang dapat diringkaskan dengan pantas dan tepat. Algoritma yang digunakan untuk membangunkan sistem ini ialah algoritma frekuensi perkataan. Projek ini berhasrat untuk membangunkan sistem yang boleh meringkaskan sesebuah teks atau petikan yang panjang, menjadi sebuah teks yang pendek dan ringkas untuk memudahkan pengguna untuk membaca dan memahami. 1 PENGENALAN Ringkasan teks memudahkan proses teks yang hendak ditulis. Pemahaman teks boleh dikenalpasti melalui pengecaman kata kunci atau perkataan yang paling banyak digunakan di dalam sesebuah teks atau petikan tidak termasuk perkataan fungsi khusus sekali kata hubung. Ringkasan teks Bahasa Melayu ini digunakan dengan peringkasan jenis ekstraktif dimana ia akan membantu meringkaskan sesebuah teks atau petikan Bahasa Melayu. 2 PENYATAAN MASALAH Memandangkan tujuan peringkasan artikel dan teks adalah untuk menghasilkan satu dokumen yang ringkas dan berinformasi, maka penentuan kata kunci yang utama amat penting. Kata kunci bagi sesebuah teks mungkin berada di awalan, pertengahan atau akhiran perenggan.

Selain itu, pengenalpastian fungsi ayat bukanlah satu tugas yang mudah. Sebaris ayat mungkin mempunyai fungsi seperti ayat penyata dan lain-lain. Dengan permasalahan yang dinyatakan, sedikit sebanyak dapat membantu untuk membangunkan sistem peringkasan teks yang mudah. 3 OBJEKTIF KAJIAN Projek ini dijalankan adalah untuk membangunkan sistem peringkasan teks dalam Bahasa Melayu. Objektif kajian ini adalah untuk mengenalpasti kata kunci dengan cara mengesan perkataan yang mempunyai frekuensi yang tinggi dalam teks atau artikel. Selain itu, ia juga bertujuan untuk membangunkan sistem yang boleh membantu pengguna untuk meringkas ayat dalam sesebuah teks atau artikel dalam Bahasa Melayu. 4 METOD KAJIAN Penggunaan model pembangunan yang sesuai amat penting bagi memastikan perjalanan projek berjalan dengan lancar dan menjamin kualiti yang baik dan memuaskan. Kaedah yang digunakan untuk pembangunan model projek ini boleh dibahagikan kepada beberapa fasa. Fasa-fasa yang terlibat ialah fasa perancangan dan analisis, fasa reka bentuk, fasa implementasi dan fasa pengujian. Model ini penting bagi memastikan perjalanan projek lancar dan teratur. Rajah 1 menunjukkan model pembangunan yang digunakan untuk membangunkan sistem peringkasan teks dalam Bahasa Melayu. 4.1 Fasa Perancangan dan Analisis Dalam fasa ini, penyataan masalah, skop kajian, objektif kajian serta jadual perancangan dikenalpasti. Pencarian bahan bacaan untuk dijadikan sebagai rujukan juga dilakukan dalam fasa ini. Hal ini kerana, ia dapat memberi kefahaman yang lebih terperinci mengenai topik kajian dan dapat mengenalpasti cara atau kaedah untuk peringkasan teks.

4.2 Fasa Reka Bentuk Dalam fasa ini pula, proses reka bentuk algorithm dilaksanakan. Pemilihan bahasa pengaturcaraan turut membantu bagi menjalankan kajian ini. Penghasilan pengaturcaraan menggunakan bahasa yang dipilih. Jika terdapat kecelaruan teknik, fasa perancangan dan analisi perlu dilakukan semula. 4.3 Fasa Implementasi Setelah fasa reka bentuk dijalankan, proses implementasi akan dilakukan. Jika terdapat ralat pelaksanaan, fasa reka bentuk harus dilakukan bagi menyelesaikan masalah yang dihadapi. 4.4 Fasa Pengujian Fasa ini dilaksanakan terhadap sistem yang dibangunkan agar dapat memenuhi skop dan objektif kajian. Jika terdapat ralat, fasa implementasi perlu dilakukan semula supaya dapat meningkatkan lagi kecekapan sistem FASA PERANCANGAN DAN ANALISIS FASA REKA BENTUK FASA IMPLEMENTASI Rajah 1: Model Pembangunan Sistem Peringkasan Teks FASA PENGUJIAN 5 HASIL KAJIAN Bahagian ini membincangkan hasil daripada proses pembangunan sistem peringkasan teks dalam Bahasa Melayu. Dalam bahagian ini juga, fungsi yang terdapat di dalam algoritma

diterangkan fungsinya dari segi input yang diterima atau hasil yang dipulangkan. Pengujian alatan ringkasan teks yang dibincangkan dalam bahagian ini akan menerangkan tentang kebolehan alatan menghasilkan ringkasan. Perisian yang digunakan untuk membangunkan algoritma ringkasan petikan Bahasa Melayu ialah Python 2.7. Algoritma yang dibangunkan untuk menghasilkan ringkasan teks Bahasa Melayu ialah dengan cara menggunakan perkataan-perkataan yang mempunyai frekuensi tinggi dalam sesebuah teks. Algoritma yang digunakan untuk membangunkan sistem ini adalah dengan menggunakan algoritma frekuensi perkataan atau word frequency. Dalam pembinaan algoritma ini, senarai yang mengandungi perkataan yang mempunyai frekuensi dan skor tinggi digunakan dalam menentukan ayat yang akan menghasilkan ringkasan. Penentuan perkataan yang mempunyai frekuensi tinggi ditentukan melalui kekerapan perkataan tersebut muncul di dalam petikan teks. Semakin kerap sesuatu perkataan itu muncul dalam sesuatu dokumen maka semakin tinggi nilai perkataan tersebut. Nilai perkataan dikira menggunakan persamaan berikut: wordlist = st.stopword(content) wordfreq = [] for w in wordlist: if (wordlist.count(w) > 6): wordfreq.append(wordlist.count(w)) f (w) = Jumlah perkataan terkandung di dalam petikan Dimana w, merupakan perkataan terkandung di dalam ayat. Akan tetapi perkataan yang berfungsi sebagai kata nama, atau kata hubung tidak diambil kira sebagai perkataan yang mempunyai frekuensi tinggi. Hal ini kerana perkataan-perkataan seperti perkataan yang, dia, ialah, kita merupakan perkataan yang kerap muncul di dalam ayat dan tidak mempunyai nilai dalam peringkasan. Ayat yang mengandungi perkataan yang nilainya tertinggi akan diambil untuk dijadikan sebagai hasil ringkasan. Alatan untuk pengujian merupakan peranan yang penting bagi memeriksa sebarang ralat yang terdapat di dalam pembangunan ringkasan teks Bahasa Melayu. Ralat yang ditemui perlu

dibetulkan untuk memastikan alatan ringkasan dapat menghasilkan ringkasan yang dikehendaki. Pengujian dilakukan ke atas algoritma yang dibangunkan iaitu algoritma frekuensi perkataan atau word frequency. Pengujian dilakukan dengan menggunakan tujuh petikan Bahasa Melayu yang di ambil dari laman sesawang. -perkataan yang mempunyai frekuensi tinggi dalam sesebuah petikan dapat dikenalpasti dengan menggunakan algoritma frekuensi perkataan. Ia juga akan dijadikan sebagai kata kunci untuk menghasilkan sebuah ringkasan. Kekerapan yang muncul dalam petikan ditunjukkan di dalam rajah. Kekerapan perkataan muncul di dalam petikan derita 8 gambaran 5 banjir 3 keadaan 4 kampung 2 Rajah 2 Frekuensi perkataan dalam petikan pertama Kekerapan perkataan muncul di dalam petikan jerebu 26 kesihatan 6 udara 5 pihak 3 kesan 3 Rajah 3 Frekuensi perkataan dalam petikan kedua

Kekerapan perkataan muncul di dalam petikan banjir 10 kawasan 10 operasi 10 menyelamat 10 bencana 8 mangsa 8 kritikal 7 negeri 7 bantuan 7 Rajah 4 Frekuensi perkataan dalam petikan ketiga Setelah berjaya menghasilkan ringkasan dari algoritma tersebut, perbandingan antara hasil ringkasan dijalankan. Ciri-ciri atau kriteria yang diambil kira ialah panjang ringkasan yang dihasilkan serta kualiti ringkasan yang dihasilkan. Perbandingan hasil ringkasan dari algoritma tersebut ditunjukkan dalam bentuk jadual. Petikan Asal Algoritma Frekuensi Jumlah perkataan 2967 2163 Nisbah hasil ringkasan dengan petikan asal (%) Jadual 1 Perbandingan hasil ringkasan dari teks pertama 27

Petikan Asal Algoritma Frekuensi Jumlah perkataan 5598 4351 Nisbah hasil ringkasan 22 dengan petikan asal (%) Jadual 2 Perbandingan hasil ringkasan dari teks kedua Petikan Asal Algoritma Frekuensi Jumlah perkataan 2931 2572 Nisbah hasil ringkasan dengan petikan asal (%) Jadual 3: Perbandingan hasil ringkasan dari teks ketiga Berdasarkan perbandingan yang telah dilakukan, didapati bahawa terdapat pengurangan di antara hasil ringkasan yang dihasilkan oleh algoritma frekuensi perkataan dan petikan asal. Hasil ringkasan yang dihasilkan oleh algoritma frekuensi perkataan difahamkan lebih bertetapan dan informasi dapat dikekalkan sebanyak yang mungkin. Hal ini kerana, kekerapan perkataan yang muncul dalam sesebuah petikan memainkan peranan yang penting dalam menghasilkan ringkasan. 6 KESIMPULAN 12 Secara kesimpulannya, sistem peringkasan teks dalam Bahasa Melayu sedikit sebanyak membantu pengguna untuk memahami sesebuah teks dengan lebih mudah dan berinformasi.

Pengujian ini dilakukan untuk memastikan sesebuah ringkasan itu dapat dihasilkan bagi memenuhi objektif kajian yang dinyatakan dalam fasa perancangan dan analisis. Secara tuntasnya, sistem peringkasan teks dalam Bahasa Melayu ini dapat membantu meringkaskan Bahasa Melayu untuk mendapatkan informasi daripada satu petikan yang panjang. Dengan adanya sistem ringkasan teks ini, masa yang diambil untuk memahami suatu teks dapat disingkatkan. 7 RUJUKAN Andreas Gohr. Open Text Summarizer Edmudson, H. P. 1969. New method in automatic extracting. Jones. Automatic Summarising: the state of the art. Luhm, H. P. 1958. The automatic creation of literature abstract. Jacob Perkins. Python Text Processing with NLTK 2.0 Cookbook Kamal Sarkar, 2009. Using Domain Knowledge for Text Summarization in Medical Domain Mohamed Abdel Fatah, Fuji Ren. 2008. Automatic Text Summarization, https://scholar.google.com/citations?user=7hd9rleaaaaj&hl=en Mohamed Abdel Fatah. World Academy of Science, Engineering and Technology. Mohd Sabri Hassan. Penjanaan Ringkasan Isi Utama Berdasarkan Ciri Kata Bagi Dokumen Berita Bahasa Melayu. Shubhamajera, 2015. Automatic Text Summarization. Suraya Alias, 2017. MYTextSum: A Malay Text Summarizer Model Using a Constrained Pattern-Growth Sentence Compression Technique Word2vec. https://code.google.com/archive/p/word2vec/