“Traditional” Data Models
- Relational Model
Model relasional adalah dekat untuk menjadi model fisik - Object-Oriented & Object-Relational Models
- Semi-Structured Models : XML, JSON
- Flexible Models and RDF : Subject, Predicate, Object
MM Data Models
- Features: Properties used for describing the media objects Eg. Color, Textures, Shape.
- Common (Feature) Representations: • Vectors • String/Sequence • Graph/Trees • Fuzzy and Probabilistic Representations (later...)
Texture Model :
• Directionality
• Smoothness
• Periodicity
• Granularity
Shape Histogram
Histogram: number of 0s, 1s, 2s....7s
• +perimeter length
• +area
• +width
• +height
• +maximum diameter
• +circularity
• +centroid momen, orientation, eccentricity, spread
Feature Repr: Vector
• A set of linearly independent basis vectors (i.e.
Dimension).
• Each data object is represented in this space. Vector
Space Model
• Example: Features of text, Histogram color of images
Feature Repr: String/Sequence
• Application: User Experience Sequences, Protein Sequence
• Comparing the sequence, Edit Distance
Distance Measure & Metric
Distance bukan negatif : (A,B)>=0
Distance = 0 jika dan hanya jika kedua objek itu identik A<->B=0->
Distance simetris : (A,B)=(B,A)
Distance itu merupakan fungsi segitiga jika (A,C) <=(A,B)+(B,C)
Minkowski distance: The Minkowski distance of order p (also referred to as pnorm
distance or Lp metric distance). The Minkowski memiliki keuntungan menjadi metrik. Dengan demikian, fungsi dalam kelompok ini membuatnya relatif mudah untuk data indeks dengan mengandalkan teknik pengindeksan multi-dimensi yang dirancang untuk data spasial
Cosine similarity: Cosine similarity is simply defined as the cosine of the angle
between the two vectors:
simcosine(v q, v o) = cos(v q, v o).
Jika sudut antara dua vektor adalah 0 derajat (dengan kata lain, jika dua vektor tumpang tindih dalam ruang), maka komposisi mereka mirip. Karena properti ini, fungsi cosine similarity umumnya digunakan, misalnya, dalam database teks.
Dot product similarity: menganggap kedua sudut dan panjang dari vektor. Hal ini juga sering digunakan untuk komputasi cosine similarity dalam aplikasi di mana vektor sudah prenormalized ke satuan panjang.
0 Comments