Một số vấn đề về số hóa tài liệu ở Việt Nam

Đại học Thái Nguyên
04:06' CH - Thứ năm, 03/09/2015

Ngày nay, sự phát triển mạnh mẽ của công nghiệp, công nghệ thông tin đã tạo ra hàng loạt các sản phẩm công nghệ phần cứng, công nghệ phần mềm và công nghệ nội dung. Các loại hình sản phẩm này đã tác động và làm biến đổi về chất các loại hình thư viện truyền thống. Dần hình thành loại hình “Thư viện số”/“Thư viện điện tử (electronic library)/ “Thư viện ảo” (virtual library),... Một trong các yếu tố để xây dựng, duy trì và phát triển loại hình thư viện này là nguồn tài liệu số/tài nguyên tri thức dạng số. Có thể nói, nguồn tài nguyên thông tin số là huyết mạch/linh hồn của thư viện số. Mục tiêu của bất kỳ Thư viện số nào là tạo ra một cổng thông tin truy cập trực tuyến đến tài nguyên số không chỉ của thư viện đó mà đến bất kỳ Thư viện số nào khác ở bất cứ đâu. Do đó, việc triển khai xây dựng Bộ sưu tập tài nguyên thông tin số là bước đi đầu tiên, quan trọng nhất để phát triển thư viện số. Khi các thư viện đã có Bộ sưu tập số sẽ tiến hành liên thông chia sẻ phục vụ cộng đồng người dùng tin trực tuyến.

Khi nói về thư viện số và nguồn tài nguyên tri thức số, ngay từ năm 1998, Liên đoàn thư viện số (Digital Libraries Federation V DLF) đã khẳng định: “Các thư viện số là các tổ chức cung cấp nguồn lực, trong đó bao gồm các chuyên gia (những người có kiến thức và kỹ năng làm việc trong môi trường số), để lựa chọn thông tin, cấu trúc hóa, đưa ra các phương thức truy cập và phân phối thông tin hiệu quả, cũng như đảm bảo sự toàn vẹn và của bộ sưu tập số sao cho chúng luôn sẵn sàng và kinh tế để phục vụ một cộng đồng cụ thể hoặc một nhóm cộng đồng

Công tác số hóa tài liệu là khâu thực sự quan trọng của một thư viện điện tử</i>

Để có Bộ sưu tập số hay nói cách khác muốn tạo lập, phát triển kho tài nguyên tri thức dạng số có 03 cách:

  • Cách thứ nhất: Mua tài nguyên thông tin điện tử từ các nhà cung cấp/xuất bản/cá nhân (trước khi in ra giấy) hoặc trao đổi với các đối tác
  • Cách thứ hai: Truy cập, khai thác từ việc liên kết đến các nguồn tài liệu số có cùng nội dung thông tin/thông tin chuyên biệt (thông tin Y học, thông tin về Luật học) trên Internet
  • Cách thứ ba: Tổ chức số hóa nguồn tài nguyên thông tin truyền thống bằng phương pháp quét hay nhập lại thông tin từ bàn phím của máy tính điện tử.

Trong ba cách trên, cách thứ ba là quan trọng nhất bởi lẽ: Mỗi một cơ quan thông tin, thư viện đều có thế mạnh riêng/bản sắc riêng nhờ vào đặc điểm vốn tài liệu mình đang lưu giữ. Đặc biệt là đặc điểm về nội dung của các loại hình tài liệu (Tài liệu quý, xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế & xã hội hiếm, có giá trị chất xám cao). Nếu số hóa được nguồn tài liệu này, xây dựng được bộ sưu tập số là vốn quý để duy trì và phát triển thư viện của mình. Từ đây, nhiều người của cộng đồng truy cập sẽ biết đến để chia sẻ khai thác nhiều lần, sử dụng nhiều lần.

Vậy, số hóa tài liệu là gì?

Đây là khái niệm vẫn còn mới đối với cộng đồng những người làm công tác thông tin, thư viện. Có nhiều định nghĩa khác nhau nhưng có nội dung chung đều cho rằng: Số hóa tài liệu là quá trình chuyển các dạng dữ liệu/tài liệu truyền thống như các bản viết tay, bản in trên giấy, hình ảnh, âm thanh, phim, dữ liệu toàn văn với nhiều định dạng khác nhau sang chữ Vn dữ liệu trên máy tính và được máy tính nhận biết được như tài liệu ban đầu gọi là số hoá dữ liệu. Hay nói cách khác số hoá tài liệu là hình thức chuyển đổi các tài liệu truyền thống bên ngoài thành dạng tài liệu số mà máy tính có thể hiểu được. Sản phẩm sau khi số hóa tài liệu chính là nguồn Tài nguyên số/dữ liệu số - các dữ liệu dạng chữ, hình ảnh, âm thanh... được máy tính nhận biết đúng định dạng và được sử dụng trên máy tính.

+ Vai trò của công tác số hóa tài liệu

Một khi nguồn tài nguyên thông tin số là mạch huyết, là linh hồn của thư viện số thì công tác số hóa tài liệu có vai trò vô cùng quan trọng. Trước hết việc số hóa tài liệu sẽ giúp giảm thiểu đáng kể diện tích, không gian lưu giữ; Thứ hai là giúp việc bảo quản, duy trì tuổi thọ của tài liệu truyền thống được lâu hơn; Thứ ba là dễ dàng mở rộng phạm vi cộng đồng người sử dụng nguồn tài nguyên thông tin của cơ quan thông tin, thư viện; Thứ tư là tiện ích trong việc truy xuất tìm kiếm thông tin ở bất kỳ đâu vào bất cứ thời điểm nào một cách nhanh chóng, dễ dàng; Thứ năm là thuận lợi trong việc chia sẻ nguồn tài nguyên thông tin của thư viện với các thư viện khác. Thứ sáu là giảm thiểu tối đa sức người, sức của cho việc quản lý nguồn tài nguyên thông tin truyền thống; Thứ bảy là góp phần nhanh chóng tái tạo thông tin mới có giá trị gia tăng cao hơn.

+ Các yếu tố liên quan đến hoạt động Số hóa tài liệu

Để tiến hành số hóa tài liệu xây dựng kho tài nguyên thông tin số cần phải chú trọng đến các yếu tố như: Xác định mục tiêu số hóa tài liệu; Vấn đề công nghệ/lựa chọn phần mềm quản lý; Lựa chọn tài liệu để số hóa; Thực hiện Quy trình số hoá và xử lý tài liệu sau số hóa chặt chẽ; Nguồn nhân lực phục vụ số hóa tài liệu; Kinh phí số hóa tài liệu; Vấn đề đảm bảo bản quyền...

  • Xác định mục tiêu số hóa tài liệu: là công việc đầu tiên khi triển khai số hóa tài liệu. Số hóa tài liệu để phục vụ nghiên cứu, đào tạo hay kinh doanh; phục vụ đối tượng cộng đồng người dùng tin nào...
  • Chú trọng lựa chọn các trang thiết bị chuyên dụng và Phần mềm quản lý tài liệu số với các tiêu chuẩn công nghệ đảm bảo chất lượng tài liệu số và quản lý tài liệu số bền vững. Phần mềm này cho phép lưu trữ và khai thác các loại tài liệu đã được số hoá âm thanh, hình ảnh, phim, dữ liệu toàn văn với nhiều định dạng khác nhau. Hỗ trợ xây dựng các giáo trình, bài giảng, sách điện tử, biến các loại tài liệu này trở thành các dữ liệu của thư viện. Cho phép bạn đọc truy cập và khai thác thông tin trực tuyến.
  • Về lựa chọn tài liệu: là việc hết sức quan trọng, bởi không có thư viện nào có khả năng số hoá toàn bộ kho tài liệu. Khi lựa chọn tài liệu trước hết cần chú trọng đến nhu cầu thông tin (nội dung, ngôn ngữ, dạng tài liệu...) của người dùng tin mà thư viện đang phục vụ. Đặc biệt là nhu cầu về nội dung tài liệu/giá trị tri thức của tài liệu gốc; Thứ hai là cần tuyển lựa các tài liệu tiềm năng/đặcthù mà thư viện mình đang lưu giữ, các thư viện khác không có; Thứ ba là tính tới các tài liệu chỉ có một bản, tài liệu sắp hư hỏng khó hồi phục; Thứ tư là tài liệu quý hiếm; Thứ năm là tài liệu chưa có nơi nào số hóa để tránh trùng lặp...
  • Thực hiện Quy trình Số hoá và xử lý các tài liệu sau số hóa chặt chẽ: số hoá và xử lý tài liệu sau số hóa là công đoạn quan trọng nhất để tạo nên một thư viện số nhờ quá trình tạo ra thông tin cho thư viện. Có rất nhiều các dạng tài liệu gốc (ví dụ như fulltext, video, audio, ảnh,...). Tài liệu có thể bao gồm cả chữ và hình ảnh, video bao gồm cả audio và hình ảnh,... Với mỗi dạng tài liệu đều có các cách xử lý khác nhau. Nhưng nói chung đều phải qua các công đoạn số hoá (tạo ra các hình ảnh số) và sau đó là xử lý để tạo ra các thông tin số. Các thông tin số này mới thực sự là đối tượng của thư viện điện tử, cho phép thực hiện thao tác sửa đổi.
  • Về nhân lực phục vụ số hóa tài liệu: Trước khi tiến hành số hóa tài liệu cần chú trọng tuyển lựa những người có khả năng tiếp nhận và làm chủ công nghệ số hóa tài liệu, đảm bảo tài liệu được số hóa có chất lượng và quản trị tài nguyên thông tin số từ nhà cung cấp thiết bị và công nghệ.
  • Về kinh phí số hóa tài liệu: Số hóa tài liệu là hoạt động cần một khoản kinh phí khá lớn, đòi hỏi cần cân đối chi phí giữa việc mua các trang thiết bị scan chuyên dụng với các phần mềm nhận dạng đảm bảo tính bền vững từ khâu phát triển, lưu giữ, bảo quản đến khai thác và kinh phí để triển khai đào tạo nguồn nhân lực số hóa tài liệu, cũng như người dùng tin để họ biết cách sử dụng hệ thống thông tin...
  • Về vấn đề đảm bảo bản quyền: Khi số hóa tài liệu cần chú trọng đến các văn bản pháp quy liên quan đến quyền tác giả như Công ước BERN (những tài liệu đã xuất bản trên 50 năm thì được quyền số hóa). Ở Việt Nam, vấn đề bản quyền đã được đề cập đến trong Bộ Luật Dân sự năm 2005, Luật Sở hữu trí tuệ và Nghị Định 100/N ĐVCP/2006 của Chính phủ quy định chi tiết và hướng dẫn thi hành một số điều của Bộ luật Dân sự, Luật Sở hữu trí tuệ về quyền tác giả và quyền liên quan.