BAŞA DÖN

ONTOLOJİ NEDİR

İncelemek için resmi tıklayınız.

1  ONTOLOJİ NEDİR

1.1 Taksonomi ve Ontoloji

Ontoloji bazen taksonomi ile karıştırılabilmektedir. Taksonomi bir alana (domain) ait verilerin sınıflanmasından ibarettir. Ontoloji ise daha geniş olup; kavramlar arasındaki ilişkiler ile kısıtları tanımlayarak bilginin ortak bir terminoloji kullanılarak paylaşılmasını sağlar.

Örneğin belge  ve doküman yönetimi alanında bir ontoloji tanımlanmak istenirse; belgeler, belge türleri ve aralarındaki ilişkiler ile kısıtların tanımlanması yeterli olacaktır. Dolayısıyla her alana özgü ontolojiler de birbirinden farklı olacaktır.

1.2 Varlık Felsefesi Olarak Ontoloji Kavramı

Ontoloji (varlık felsefesi) varlığı var olmak bakımından ve ne olduğunu inceleyen, varlığın temel özelliklerini konu alan felsefe dalıdır. Ontoloji; bir şeyin genel olarak özünü, cismin özünü, özelliklerin özünü, ilişkilerin özünü araştırırken “Bir şey nedir?”, “Bir özellik nedir?” ve “Bir ilişki nedir?” sorularını cevaplamaya çalışır. Bu türden sorulara verilecek cevaplar ‘şey’, ‘cisim’, ‘ilişki’ terimlerinin “Bir cisim şu şudur” gibi tanımlarından ibarettir. Felsefe soyut varlığı ele almasına karşın bilim, bunun aksine somut varlığı ele alır ve bunu bir bütün olarak değil parçalara ayırarak inceler.

1.3 Bilgi Teknolojilerinde Ontoloji Kavramı

Bilgi teknolojileri alanında ontoloji belirli bir bilgi alanındaki (domain) varlıkların, kavramsal olarak anlamlarını ve aralarındaki ilişkileri içeren bir sözlük olarak tanımlanabilir. Veri ve bilginin anlamını ifade ederek bilgisayarlara (yazılım) tanıtmak ontoloji kullanmak ile başarılabilir. Ancak, böylelikle veri/bilgi, etmen (agent) yazılımlar veya çıkarsama servisleri tarafından algılanıp kullanılabilir.

Burada bilgi alanından kasıt, ortak kavramların kullanıldığı süreçler veya alanlardır. Ontoloji, sadece sınıflar hakkında bilgi içermekle kalmayıp aynı zamanda sınıfların öznitelikleri, sınıf ve öznitelikler arasındaki ilişkiler ile sınıf ve özniteliklerin birer örneklerini içerir. Bu çalışma kapsamında özniteliklere ait örnek değerler yapılmamıştır. Ontoloji, bir veri/bilgi etki alanı oluşturmak amacıyla, kavramlar veya nesne sınıfları tanımlamak için kullanılan bir dil veya mekanizmadır. Ontolojilerin ana özelliklerinden birisi diğer ontolojiler tarafından kullanılabilmesidir.

Ontoloji ortak bir kavramsallaştırmanın açık ve biçimsel gösterimidir[1]. Kavramsallaştırma, dünya üzerinde gözlemlenebilen herhangi bir olaya veya duruma ait kavramların belirlenmesiyle, bu olay veya durumun soyut bir modelini oluşturma anlamına gelir. Gösterimin açık olması, kullanılan kavramların tipinin ve bu kavramların kullanımıyla ilgili kısıtların açıkça belirtilmesidir. Biçimsel gösterim, yaratılan ontolojinin makineler tarafından okunabildiği anlamına gelir.

Kavramsallaştırmanın ortak olması ise, ontolojinin genel olarak kabul edilmiş bilgiyi modellemesi  olarak algılanabilir. Ontolojiler, tanımlamalar ve sınıflar olmak üzere iki yapı ile ifade edilirler.

Tanımlamalar, uzmanlar tarafından geliştirilirler ve ayırt edici özelliklerine (bölümler, fonksiyonlar ve öznitelik bilgileri) ve anlamsal ilişkilerine (parçasıdır, bütünüdür, bir –şey-dir/dır) göre depolanırlar. Bu yapı vasıtasıyla mevcut bilginin anlamı hakkında bilgi sağlanır. Bu sayede kullanıcılar, veri tabanında ne olduğunu sorgulayarak öğrenebilirler. Sınıflar ise, ontolojilerin gerçeklenmesinin bir sonucudur. Ontolojiler, değişik alanların belirli özelliklerini tanımlamak için sınıflandırılabilir.

Bilgisayar biliminde ontolojiler;

  • Üst seviye ontolojiler
  • Orta seviye ontolojiler
  • Alan ontolojileri

olarak üç grupta toplanırlar.

Üst seviye ontolojiler, orta seviye ve alan ontolojilerinin her ikisi için de kullanılabilecek kavramları kapsamaktadır. Üst seviye ontolojisi bütün alanlarda aynı olan çok genel kavramları tanımlar. Genellikle bu kavramlar, bütün alanlarda benzer olan varlıklar ve kurallar sınıflarından oluşmaktadır. Üst seviye ontolojiler, farklı kaynaklardan elde edilen heterojen bilginin birleştirilmesinde anahtar bir teknoloji olarak kullanılmaktadır. Üst seviye ontolojilerinin kullanım amacı, ontolojiler arasında anlamsal birlikte çalışabilirliğin desteklenmesidir. Daha belirli alan ontolojileri için bir temel role sahiptir.

Bazı üst seviye ontolojiler ile üst veri standartlarının bazı temel elemanlarının eşlenmesine ihtiyaç duyulmaktadır. Bu eşleme işlemi, üst veri elemanlarının tanımlayıcı özelliklerinin geliştirilmesine yardımcı olmaktadır. Dublin Core, web ortamında bilgi kaynaklarının tanımlanması için kullanılan bir üst veri standardıdır. On beş adet üst veri elemanından oluşan bir kümedir. Elektronik belge yönetim standardıyla belirlenen üst veriler de belgelerin tanımlanması için kullanılan bir küme oluşturur. Üst veri elemanları için temel modeller olarak üst seviye ontolojilerin kullanımı, bilgi gösteriminin yeniden kullanımı için önemlidir.

Orta seviye ontolojiler, alan ontolojileri içinde belirlenen alt seviyedeki alana özel kavramlar ile üst seviye ontolojilerinde tanımlı soyut kavramlar arasında bir köprü görevi görmektedir. Herhangi bir seviyede ontoloji eşlemesi gerçekleşebilir. Orta seviye ontolojiler ile üst seviye ontolojiler arasındaki eşleme alanları arasında kavramlar eşlemeyi sağlar. Orta seviye ontolojiler, üst seviye ontolojilerindeki soyut kavramların daha somut gösterim şeklidir. Böylece bu ontoloji kategorisi, ortak olarak kullanılan kavramları gösteren ontoloji kümelerini kapsar. Orta seviye ve üst seviye ontolojilerin kullanımı, alan ontolojilerinin eşlenmesi veya birleştirilmesi işlemlerinde kolaylıklar sağlamaktadır.

Alan ontolojisi ise, belirli alana özel kavramları ve kavramların ilişkilerini gösterir. Aynı kavramlar birçok alanda varken, kavramların gösterimi alan içeriklerinin farklılıklarından dolayı değişmektedir. Alan ontolojileri, orta seviye veya üst seviye ontolojilerinde tanımlanan kavramların eklenmesiyle genişleyebilir. Daha belirli alan ontolojileri için üst seviye ontolojileri temel rol oynamaktadır.

1.4 Ontolojiye Neden İhtiyaç Duyulur

Web’de anahtar kelimeye dayalı olarak bilgiye erişim sunan arama motorları günümüz web siteleri için kullanılan temel araçlardır. Web siteleri için kullanılan bu araçlar, bilgi yönetiminde büyük başarılar sağlayamamaktadır.

Bunun nedenleri aşağıda sıralanmıştır:

  • Bilgi arama

Web sitelerinde bilgi araması genellikle anahtar kelimelere dayanan arama motorları sayesinde gerçekleşir. Anahtar kelimeye dayalı olarak bilgi arama sürecinde kişi ve kurumların konuyla doğrudan ilgili bilgilere ulaşması zordur.

  • Bilgiye erişim

Web siteleri için anahtar kelimeye dayalı tarama sayesinde belgelere ulaşım, hem zaman hem de enerji kaybı anlamına gelmektedir. Anahtar kelimeye dayalı aramalar, farklı anlamlara sahip, fakat yazılışları aynı olan terimlerin yer aldığı konuyla ilgili olmayan gereksiz birçok bilgiye erişim sağlar. Aynı şekilde, aynı anlama gelip farklı terimlerle ifade edilen bilgilere de erişimi engeller.

  • Bilgi ediniminin sürdürülmesi

Web sitelerinde aranan bilgilere ilişkin terminolojideki tutarsızlıklar olumsuzluğa neden olur.

  • Bilginin açığa çıkışı ve görülmesi

Kurumlara ilişkin veri tabanlarındaki mevcut yeni bilgilerin veri madenciliği kullanılarak alenen ortaya çıkışı bir olumsuzluktur. Yine belli bilgiler saklansa bile web üzerinde yer alan veri tabanlarından bilgiye erişilebilmesi mümkündür. Bu durum kurum ve çalışanlarına ait bazı bilgilere erişimin sınırlandırılmasını gerektirmektedir,

Günümüz web sitelerine ilişkin tüm bu olumsuzluklar, bilgi yönetimi sistemlerinde önemli zayıflıklar olduğunu göstermektedir. Semantik web teknolojileri bu olumsuzluklara çözüm olarak düşünülmektedir.

1.5 Anlamsal (Semantik) Web

Anlamsal web’in (web 3.0) temel yapı taşı kavramları ve ilişkileri tanımlayan ontolojilerdir. Anlamsal web, web’deki veriyi hem insanların okuyabileceği hem de makinelerin anlayabileceği şekilde tanımlar ve bağlar. Bilgi gösterimi, bilgi getirme, veritabanları, çok etmenli sistemler, doğal dil işleme ve makine öğrenimi gibi birçok alanı kapsayan anlamsal web, web bilgisinin anlamını modeller.

Web sitelerinin 1990–2000 yılları arasındaki dönemi kapsayan ilk jenerasyonu HTML sayfalarının sunucu üzerinden yayınlanması biçimindedir. 2000 yılında başlayan web 2.0 ise, önceki jenerasyondan daha dinamik ve daha interaktif  belgelerin yer aldığı sitelerden oluşur. Anlamsal web öncesi web siteleri, insanların okuması için bilginin nasıl gösterileceğini ve web sayfalarında bu bilgilerin nasıl düzenleneceğini tanımlayan HTML’ ye dayanmaktadır. HTML’ ye dayalı web sitelerinde bilgiye erişim manüel olarak girilen anahtar kelimelerle sınırlıdır ve mevcut bilgilerin çoğu doğal dilde sunulmaktadır. Merkezinde insan, makine ve bilgi olmakla birlikte web 2.0, insan öğesi olmaksızın verileri anlayamaz ve geliştiremez.

Web 2.0’ın söz konusu zorluklarına karşın, bilgiyi makinece yorumlayabilen yeni nesil web siteleri olarak bilinen anlamsal web (web 3.0) gündeme gelmiştir. Web 3.0, bilginin makineler (programlar) tarafından yorumlanmasına imkân tanır. Böylece makineler, belgeler arasındaki mevcut bağlantıları bildirmekten ziyade farklı bilgi kaynakları arasındaki ilişkiyi kurabilirler.

Anlamsal web iki konu ile yakından ilgilidir:

  • Verinin değişimi için ortak formatlar,
  • Verinin gerçek nesneler ile ilgisini kuran programlama dili.

1.6 Anlamsal Web ve Ontoloji

Anlamsal web, bilgi sunumu için standart olarak ontolojiyi kullanır. Ontolojiler, insanlar tarafından oluşturulan sembollerin anlamlarının makinelerce işlenmesini sağlar. Böylece bilgi, anlamsal web üzerinde paylaşılabilir, tekrar kullanılır ve değiştirilebilir. Web ontolojisi, web üzerindeki bir alanda (domain, özel bir konuya ait bilgi alanı), paylaşılabilinir bilgiye ulaşmak isteyen ihtiyaç sahiplerine nesnelerin kurallı tanımını yaparak ortak kelimeler ve anlamlar sunmaktadır.

Ontolojiler genel olarak terimlerin sınırlı bir listesi ile bu terimlerin arasındaki ilişkilerden ibarettir. Ontolojiler sayesinde özellikle anlamsal web etmenleri, eriştikleri bilgiyi yorumlayabilirler ve diğer etmenlerle iletişim kurarak web hizmetlerini geliştirebilirler.

Farklı veri tabanlarında, aynı kavram için farklı tanımlar kullanılmaktadır. Anlamsal web’de ontolojiler kullanılarak bu tür problemler çözülmeye çalışılmaktadır. Bir anlamsal web dokümanında mevcut olan terimlerin anlamları ve bu terimler arası ilişkiler, hazırlanacak olan bir ontoloji ile anlaşılabilir hale getirilmektedir. Anlamsal web’de aynı kavram için farklı tanımların kullanımından kaynaklanan sorunlar ontolojiler kullanılarak ortadan kaldırılmaktadır.

Bir tanımı ontoloji olarak adlandırmak için aşağıdaki özelliklerin mevcut olması gerekmektedir:

  • Sınırlı kontrollü sözlükler
  • Belirli anlamdaki terim ve sınıf ilişkileri
  • Sınıflar arasındaki hiyerarşik alt sınıf ilişkileri

Zorunlu olmayan özellikler ise şunlardır:

  • Her sınıf için özellik tanımlamaları
  • Ontolojiye bireysel olarak dâhil olma
  • Her sınıf için değer kısıtlama tanımı

Olması arzulanan, fakat zorunlu ve tipik olmayan özellikler şunlardır:

  • Ayrık sınıfların tanımlanması
  • Terimler arası mantıksal ilişkilerin tanımlanması

Anlamsal web’in sunacağı hizmetlerin gerçekleştirilmesinde şu anki web’e anlam eklenmesini sağlayacak yeni dillerin tanımlanması şarttır. Anlamsal web için hazırlanacak dillerin üç özelliği içermesi gerekmektedir:

  • İçeriklerinin otomatik olarak işlenebilmesini sağlayacak biçimsel sözdizimleri (“syntax”),
  • Biçimsel anlamsallar (“semantic”),
  • Etmenlerin ve insanların bilgi paylaşımını sağlayacak standartlaşmış sözlükler.

2  ONTOLOJİ DİLLERİ

2.1 Giriş

Ontoloji dilleri genelde; ontoloji geliştirmek ve ontoloji yardımıyla web ortamındaki nesneleri tanımlamak için kullanılmaktadır, bu ise RDF’ dir. İlk RDF, web 3.0’ın temel dili olup verileri ve üst veriyi tanımlamak için kullanılmıştır. Ayrıca RDF, grafik veri formatı da kullanır. RDF grafiği, hemen her veri başlığının URI olarak isimlendirilen tek bir veri tanımlayıcısına sahip olduğu hem de her veri başlığının, diğer başlıklarla bağlantı kurulabileceği fikrine dayanır. Bu yüzden semantik web programcıları URI’ li veriler yaratırlar; URI’ lerle isimlendirilen ilişkileri kullanarak bu verileri birbirlerine bağlarlar. Böylelikle veriler, RDF ve popüler ontoloji belirleme dili olan OWL (Web Ontology Language) kullanılarak tanımlanıp birbirlerine bağlanabilirler. Aşağıda Ontoloji dilleri ilgili detaylara yer verilmiştir.

2.2 Ontoloji Dilleri

Aşağıdaki ontoloji dilleri geliştirilmiştir:

RDF: RDF (Resource Description Framework) bilgisayarlarca işlenecek verinin anlamını temsil edecek olan bir veri modelinin düzenlenmesini sağlamaktadır. RDFS (RDF Schema) gösterimi ise,  RDF veri modelini genişleterek, alanda kullanılacak sözcük kümesini nesneler, nesneler arası ilişkiler, özellikler ve özelliklerin alabileceği değerler açısından tanımlamaktadır.

RDF, XML üzerine inşa edilmiştir. W3C, XML’ i HTML’ nin genişletilmiş bir versiyonu olarak veri depolama amacıyla oluşturmuştur. XML, veri depolama ve web üzerinden veri değişimine imkân tanır; ancak, verinin anlamı hakkında hiçbir şey söyleyemez. Yani XML, yetersizdir ve aynı anlama gelen farklı terimleri anlayamaz. Örneğin <fiyat>120 TL</fiyat> ile <ücret>120 TL</ücret> etiketlerinin aynı anlama sahip olabileceğini programlar anlayamaz. Bu noktada ontolojiler gibi semantik web teknolojilerine ihtiyaç duyulur.

OWL: W3C tarafından 2002 yılında geliştirilen OWL (Web Ontology Language) yaygın olarak kullanılmaktadır. RDF(S)’e göre daha güçlü bir çıkarsama mekanizması sunarlar.

OWL, ontolojileri tanımlamak ve çeşitlemek için kullanılan bir dildir. OWL, bilginin içeriğini sadece insanlara gösteren değil, bunun yanında bilgisayarlar tarafından işlenebilmek üzere tasarlanmıştır. OWL, XML, RDF ve RDF-S tarafından desteklenen web içeriğinin bilgisayarlar tarafından daha iyi yorumlanabilmesini sağlamayı hedef almaktadır. OWL; OIL ve DAML+OIL gibi dilleri temel alır. OWL, DAML+OIL web ontoloji dilinin araştırma tabanlı bir sürümüdür. OWL dilinde terimler arasındaki bağlantı RDF söz dizimi ile yapılmaktadır. Söz dizim kuralları bilgiyi anlamlaştırmak için tasarlanmıştır.

OWL üç alt dile sahiptir: OWL Full, OWL DL ve OWL Lite. Bu üç dil, kullanıcılar için özel olarak tasarlanmıştır.

OWL Full: Tanımlama bilgisinin hesaplama bilgisinden önemli olduğu durumlarda kullanılabilir. RDF ve RDF(S)’in bütün bileşenlerinden yararlanır. RDF’ in sağladığı tüm kolaylıkları sağlar, ancak hesaplanabilirliği desteklemez, tam kararlı olmadıklarından kavramlar arasında tam ve etkili bir mantık yürütemez.

OWL DL: OWL Full’ un bir alt dilidir; terimlerin anlamlarını tanımlamada kolaylık sağlayıp, otomatik hesaplamaları mümkün kılar. OWL ve RDF’ i oluşturan yapılara kısıtlar ekleyerek kullanılır. Bu kısıtlar tanımlama mantığı bağlantısını sağlar.

OWL Lite: OWL dilinin tek bir kısmı ile OWL DL’nin kısıtlarını kullanır. OWL Lite, sadece üst sınıfı tanımlar. Üst sınıflarında karar yapıları kullanılır. Sınıflar arasında eşitlik ve alt sınıf ilişkileri vardır. OWL Lite mantıksal sonuçlarını değerlendirerek iki değer gönderir. Bu değerler 0 ve 1 dir. Özellikle durum belirteçlerinde eğer bir çıkarım varsa 1, diğer durumlar 0 kabul edilir. Örneğin bir bilgisayarın sahip olduğu işlemci, ana kart, ram belleğine bakıldığında sunucu özelliği varsa 1, diğer durumlarda 0 değeri gönderilir.

DAML, OIL: Bu bir semantik web ontoloji dilidir ve ABD Hükümetinin desteği ile DAML (DARPA Agent Markup Language) ve Avrupa Birliği tarafından geliştirilen OIL (Ontology Interface Layer) ontoloji geliştirme dilleri de tanımlanmıştır. ABD ve AB tarafından ilk olarak 2000 yılında geliştirilen ve 2001 yılında da son sürümü yayınlanan DAML+OIL dili de pek çok araştırıcı tarafından kullanılmaktadır.  En temel amacı ise web üzerinde bulunan bilginin bilgisayarların anlayacağı hale getirilmesidir.

3  ONTOLOJİ ALANINDA YAPILMIŞ ÇALIŞMALAR

3.1 Giriş

Bu kısımda belge ontolojisine en yakın örnekleri kapsaması bakımından uluslar arası literatürde yapılmış olan doküman ontoloji çalışmalarından örnekler verilecektir.

Doküman Ontolojisi çalışmaları özellikle son yıllarda hızla kullanılmaya başlamış olup özellikle de bilgi ve belge yönetimi alanında paylaşılabilinir bilgiye örneğin e-belge, dijital doküman’a ulaşmak isteyen ihtiyaç sahiplerine bu bilgilerin kurallı tanımlarının yapılarak ortak kelimeler ve anlamlar bütünlüğü içinde sunulmasını kapsamaktadır.

Dokümanların kullanım yerine göre farklı farklı doküman ontolojileri tasarlanmıştır, bu çalışmalardan bazıları aşağıdaki paragrafta anlatılmaya çalışılmıştır.

3.2 Semantik Doküman Mimarisi Doküman Ontolojisi

Semantik doküman mimarisi doküman ontolojisinin [5] amacı web üzerindeki dokümanların tıpkı ofis dokümanları gibi işlenmesini sağlamaktır. Bunun için üç tür ontoloji geliştirilmiştir;

  • Doküman Ontolojisi: Web ortamında dokümanları tanımlamak için kullanılır.
  • Doküman Değişimi Ontolojisi: Web ortamında bulunan dokümanların transferleri için kullanılır.
  • Kullanıcı Model Ontoloji: Dokümanların kullanıcılara sunumları sağlamak için kullanılır, her kullanıcıya farklı sunum yapılabilmesini sağlar.

Bu doküman ontolojisi düğüm noktaları dokümanlara ait birimleri temsil eden bir graf şeklinde sunulurlar (DU:Document Unit). Doküman Birimlerinin tipini ve dokümanlar arasındaki ilişkileri içerik birimi (CU: Content Unit) ile Bilgi Birimi (KU: Knowledge Unit) kavramları belirtilmektedir.

İçerik Birimi dokümana ait dijital içerik bilgisini, farklı formlarda sunar; örneğin Grafik, Metin, Ses ve Video formatları şeklinde. Buna karşılık Bilgi Birimi ise; bu içeriğin toplu kümesini sunarak  içerik birimleri arasında dolaşımı sağlar; örneğin paragraf, bölüm, tablo arasındaki geçişler.  Bir paragraf birkaç metin fragmanından ve grafiklerin belli sıralamasından meydana gelebilir. Buna ilaveten içerik birimleri arasındaki ilişkileri de tanımlar bunlar; dokümana ait tür, kavram, konu ve özelliklerdir.

Aşağıdaki şekilde bu tür bir doküman Ontolojisi verilmiştir.

Şekil 1: Semantik Doküman Mimarisi Doküman Ontolojisi

3.3 SALT Doküman Ontolojisi

SALT (Semantic Annotated LaTeX) [6] semantik yayın çıkarma çerçevesini sunarak, ek açıklamalar ile bilimsel yayınları zenginleştirmeyi hedefler. SALT doküman ontolojisi (SDO) bilimsel yayınların lineer yapısını belirleyerek yayın içeriklerinin tanımlanabilmesinde ve revizyonlarının yapılıp izlenmesinde yardımcı olur. Ana hedefi ise bilimsel yayınların içerik modelini farklı boyutlarda/seviyelerde sunmaktır. Bu ontoloji dokümanlar üzerindeki içerik örneklerinin birbirleri ile ilişkilendirilmesinden ibarettir, bunun için hasText (İçerir) özelliği tanımlanmıştır. Aşağıdaki şekil bu ontolojiyi tasvir eder, ayrıca dokümanlara ilişkin kavramlar ve özellikleri de detaylı olarak veren bir ontoloji modelidir.

Şekil 2: SALT Doküman Ontolojisi

SDO ontolojisi ilk önce sistem içinde var olan nesneleri ve özellikleri belirleyerek işe başlar.

Örneğin yukarıdaki ontoloji modeli için bir varlık listesi oluşturulmuş daha sonra da bu varlık listesindeki sınıflar ve özellikler detaylandırılmıştır, sistemin en üstündeki sınıf ise kaynak (Resource), sınıfı olup şekilde verilmemiştir diğer tüm sınıflar bu sınıfın altsınıfıdır.

Varlık listesi: Sınıflar ve Özellikleri

Classes

Publication, Section, Paragraph, Sentence, TextChunk, Revision, Table, Figure

Properties

hasSection, hasSubSection, hasParagraph, hasSentence, hasTextChunk, hasRevision, hasOrderNumber, hasStartPointer, hasEndPointer, hasSectionTitle, hasCaption, hasTable, hasFigure, hasRevisionDate, hasLocation, hasAnnotation, hasSALTVersion


Ontoloji sınıflarını tanımlamak:
Publication

Superclasses

rdfs:Resource

Subclasses

--

In domain of:

sdo:hasSection, sdo:hasSALTVersion, sdo:hasLocation, sao:cites, sao:isCitedBy, sao:hasCitationKey, sao:hasCitationContext

In range of:

sao:cites, sao:isCitedBy, sao:pointsTo


Ontoloji özelliklerinin tanımlanması:
hasSection

Type

rdf:Property, rdfs:Resource

Domain

sdo:Publication

Range

sdo:Section


3.4 Ajan Tabanlı RDF(S) Doküman Ontolojisi

Ajan Tabanlı Doküman Ontolojisi [7] yüksek öğrenim ortamında bilgi kaynaklarına erişim için tasarlanan ajan mimari tabanlı bir sistemdir. Burada öğrenciler ve öğretim elemanları tarafından üretilen/kullanılan tüm dokümanlar RDFS (Resource Definition Framework Schema) kullanarak tanımlanmaktadır. Bu modelde; farklı işlevleri gerçekleştiren üç ajan (agent) bulunmaktadır, kullanıcı ile etkileşim, ontolojinin düzenlenmesi ve üstveri kullanarak arama yapma.

Bir yüksek öğrenim kurumundaki öğrenciler değişik bilgi ve belge kaynaklarına hem erişirler hem de bu tür bilgi ve belge üretirler. Öğrenim bilgi yoğunluklu bir aktivite olduğu için bilgi yönetimi ve bilginin kayıt edilmesi büyük önem taşır. Bilginin tanımlanması ve bilgi kaynaklarının oluşturulması önem arz eder. Bu nedenle bilgi yönetim teknolojileri ve stratejilerinin uygulanması onların gelecekteki eğitim aktivitelerine önemli katkılar sağlayacaktır. Kullanılmakta olan DCMI (Dublin Core Metadata Initiative) ve RDF (Resource Description Framework) ve OWL (Ontology Web Langauage) metodolojileri farklı dokümanları tanımlamak ve kategorize etmek için önemlidir (ev ödevi, makale yazma, raporlama). İşte bu nedenle doğru ontolojinin geliştirilmesi yardımıyla dokümanların yönetimi için gerekli araçların geliştirilmesi yapılabilir.

Bu ontolojide öncelikle sistemde kayıt altına alınacak olan dokümanlar ve doküman tiplerinin belirlenmesi çalışması ile doküman taksonomi hiyerarşisi yapılır.[7]. En yukarıda kök olarak da adlandıran üst doküman sınıfı bulunur, alt dallarda ise ilgili köke bağlı dokümanları karakterize eden dokümanlar bulunur, bunlar en soyut hali ile verilirler. Bu tür bir taksonomi çalışmasında dokümanlara ait ortak özellikler belirlenerek dokümanların tanımlamalarına yardımcı olunur. Örneğin bir doküman içinde en azından şu özellikler bulunur; başlık, içerik tanımı, yazarı gibi. Farklı bir bakış açısı ile de dokümana ait tek bir öznitelik belirlenerek diğer dokümanlarla olan ilişkisi belirlenebilir. Bu dokümanlara ait öznitelik sınıflarının belirlenmesi ile farklı kavramsal içerikleri bulunan dokümanların ortak özellikler kullanılarak etkin ve hızlı erişimi sağlanabilir. Aşağıdaki şekilde bu tür bir ontolojinin sunumu verilmiştir.

Şekil 3:Yüksek Öğrenim Doküman Ontolojisi

Bu ontolojide bazı özellikleri doküman tipleri arasında paylaşılmakta hem de bu özellikler dokümanların tanımlanmasına yardımcı olmaktadır. Örneğin her dokümanda olması gereken özellikler şunlardır; başlık (title), tanım (description) ve kaynak yeri (URL). Buna ek olarak dokümanın domain ontoloji içinde diğer dokümanlarla ilişkisini belirten hasConcept (vardır) özelliği bulunur.

Yukarıdaki şekilde bu tür bir ontoloji modeli verilmiştir, burada doküman (document) hiyerarşinin en üstünde yer alır (root) diğer dokümanlar sadece soyut olarak verilmişlerdir. Şekil içindeki diğer sınıflar olan assignment, report ve notes ise document sınıfının bir altsınıfıdır. Bu kavramlar ilgili alana özgü özel dokümanları tanımlarlar ve böylece de birbiri ile ilişkili dokümanlara ve kavramlara erişim kolayca sağlanabilir. Aşağıdaki şekilde bir dokümanın özelliklerinin birbirleriyle olan ilişkisi verilmiştir.

Şekil 4: Bir dokümana ait özellikler ve ilişkileri

Bu tür doküman ontolojileri RDF[3] (Resource Description Framework) veya RDFS[4] kullanılarak sunulurlar. Bu modelde bilgi kaynaklarının semantik olarak sunumu standart XML kullanılarak yapılmaktadır. Bu model üç ana öğe üzerine kurulmuştur; kaynak, öznitelik ve değer (resource, property, value), bu ise o dokümana ait üstveriyi ifade eder. Bu stratejinin odaklandığı nokta ise bu ontolojinin bir işaretleme dili olan XML ile nasıl sunulacağı, nasıl paylaşılacağı ile farklı kullanıcılar için tekrar kullanılabilirlik konularıdır. Bu tür bir doküman ontolojisi aşağıdaki gibi sunulabilir; burada doküman, ödev ve rapor grafa ait düğümleri gösterir ve alt sınıflar da dokümana ait sınıfları ifade eder. Burada ilişki subClass (altSınıfı) ile ifade edilmektedir, yani bir doküman bir dokümanın altsınıfı olabilir.

Şekil 5: RDF Şemasına Göre Dokümanlar ve İlişkileri

Aşağıdaki şekil (Şekil 6) bir dokümanı tanımlayan bir graf olarak verilmiştir. Bu şekilde #article01 dokümanı tanımlamak için kullanılmış olan bir ID’ dir ve rdf:type ise dokümanın tipini tanımlamak (paper) için kullanılmıştır. Bunlara ek olarak doküman özellikleri ile doküman sunulmuştur, dc:title ve doc:url.

Şekil 6: RDF Şemasına göre dokümanın graf olarak gösterilmesi

Bu doküman RDF olarak aşağıdaki gibi tanımlanabilir, burada ekstra özellik olan FOAF[8] (Friend Of a Friend) dokümana ait yazar bilgisini vermek için tanımlanmıştır.

<rdf:Description rdf:about=”#article01”>

<rdf:type rdf:resource=”#paper”/>

<dc:title>Knowledge Management for

Beginners</dc:title>

<doc:url>www.…./article01.pdf</doc:url>

<doc:hasConcept rdf:resource=”#Knowledge”/>

<author>

<foaf:person>

<foaf:name>A. Rojas</foaf:name>

<foaf:mbox>[email protected]<foaf:mbox>

</foaf:person>

</author>

</rdf:Description>


Yorumlar
XDaha önce yorum yapılmamış
Yorum Yapın