giới thiệu Linked Data và Semantic web
Linked Data (dữ liệu liên kết) và Semantic web (web mang ý nghĩa) là cái gì? nói một cách đơn giản thì Semantic web là một công nghệ của web 3.0 - một cách để liên kết dữ liệu giữa các hệ thống, các thực thể để làm phong phú thêm thông tin, tự mô tả tương quan của dữ liệu có sẵn trên bộ các web trên phạm vi toàn cầu.
về bản chất nó là một sự thay đổi trong suy nghĩ từ việc xuất bản các tài liệu HTML mà con người có thể đọc được sang một loại tài liệu mà máy tính dễ dàng đọc được rồi sau đó thể hiện cho con người.
Web ngày nay đang đổi như thế nào?
Ngày nay, phần lớn dữ liệu chúng ta nhận được từ web đều dưới dạng các trang web - những trang HTML được liên kết với nhau qua các siêu liên kết (hypelinks). cả con ngưòi và máy tính đều có thể đọc được những tài liệu này, nhưng không đơn giản như việc tìm kiếm từ khóa trong trang, máy tính gặp rất nhiều khó khăn trong việc truy xuất ý nghĩa từ dữ liệu của các tài liệu này.
Tim Berners-Lee: The next web
Nhập Linked Data - giải phóng cơ sở dữ liệu web từ hệ thống sẵn có
Thế gới web chứa một lượng thông tin rất lớn, nhưng thông thường những dữ liệu thô không có sẵn - chỉ có các tài liệu HTML được xây dựng từ dữ liệu - mọi trang web đều được xây dựng từ dữ liệu.
do đó Sematic Web cố gắng tạo ra sự thay đổi "cảnh quan
của Internet đối với vấn đề này bằng một số cách sau:
- mở của dữ liệu trên web để cho các tiến trình trí tuệ nhân tạo (Artficial Inteligence) (web có thể suy nghĩ một chút thay cho con người)
- khuyến khích các công ty, các tổ chức và cá nhân xuất bản tự do dữ liệu của họ theo một định dạng chuẩn chung.
- khuyến khích các công ty sử dụng dữ liệu đã có sẵn trên web (cho và nhận dự liệu).
nói một cách nôm na, ta sẽ thu thập toàn bộ dữ liệu đã được xuất bbanr trên các tài liệu HTML từ mọi nơi trên Internet thêm những mô tả về mô hình dữ liệu cho phép chúng đưọc đối xủ và nghiên cứu như trên một cơ sở dữ liệu duy nhất.việc tự động nghiên cứu toàn bộ dữ liệu của loài người trên Internet chắc chắn sẽ đem lại lợi ích vô cùng lớn.
nhưng tôi phải bắt đầu từ đâu?
không quá phức tạp đâu, chúng tôi đã xây dựng một sẻies các giới thiệu về các công nghệ liện quan đến Sematic Web và Linked Data.
- TUT 1 giới thiệu Graph databse - cho bạn một cái nhìn tổng quan về cách lưu trữ dữ liệu semantic web.
- TUT 2 tổng quan về RDF - giới thiệu Resource Description Framework (RDF), định dang semantic sử dụng để lưu trữ trong graph databases.
- TUT 3 Semantic Modeling -giới thiệu một khía cạnh rất quan trọng diễn tả ý nghĩ của dữ liệu.
- TUT 4 giới thiệu RDFS & OWL -cú pháp quan trọng semantic web sử đụng để giải mã ý nghĩ sang dữ liệu.
- TUT 4 Truy vấn Semantic Data -làm sao để truy vấn sematic data sử dụng giao thức SPARQL.