Thư viện kỹ thuật số của hãng tìm kiếm Google chứa các tác phẩm được xuất bản suốt 2 thế kỷ qua đã hỗ trợ hiệu quả cho các nhà ngôn ngữ trên thế giới nghiên cứu 2 thế kỷ phát triển ngôn ngữ cũng như các xu hướng xã hội và tình cảm con người trên toàn cầu.
Theo số liệu của Google, kể từ khi phát minh kỹ thuật in và máy in, trên thế giới đã có khoảng 129 triệu cuốn sách được xuất bản. Năm 2004, Google bắt đầu đưa các cuốn sách này vào thư viện kỹ thuật số của mình và cho tới nay, hơn 15 triệu cuốn với hơn 2.000 tỉ từ của 400 ngôn ngữ trên toàn cầu đã có phiên bản điện tử trong thư viện này. Các nhà phân tích ngôn ngữ trên thế giới có thể nghiên cứu, chọn lọc trong kho ngôn ngữ đồ sộ này để phát hiện sự phát triển bùng nổ của ngôn ngữ với các từ mới được tạo ra, các xu hướng kiểm duyệt và những biểu hiện ngôn ngữ, những danh nhân của các dân tộc và thế giới.
Các nhà ngôn ngữ học trường Đại học Harvard, Viện Công nghệ Massachusetts, Bách khoa toàn thư Britannica và hãng Google đã công bố dữ liệu 2 tỉ từ trong 5,2 triệu cuốn sách được xuất bản trong 2 thế kỷ qua. Với công cụ này, các nhà ngôn ngữ đã xác định được các xu hướng phát triển xã hội và ngôn ngữ thông qua ngôn ngữ mà các tác giả đã sử dụng và những con người mà họ đề cập.
Mark Libermam, nhà ngôn ngữ trường Đại học Pennsynvania cho biết, các nhà ngôn ngữ học Mỹ đã xác định được các mô hình bối cảnh văn hóa, không gian và thời gian với quy mô gấp hàng triệu lần so với trước đây. Các nhà khoa học nghiên cứu các lĩnh vực khác cũng có thể sử dụng dữ liệu trong thư viện kỹ thuật số của Google để xác định các mô hình, các khái niệm xã hội và tình cảm con người được phát triển suốt 2 thế kỷ qua.
Anh Tuấn (P/v TTXVN tại New York)