Đăng ký Đăng nhập

Trang chủ Nghiên cứu về đánh dấu văn bản chữ viết tay tiếng Việt với giải thuật Dynamic Ti...

Tài liệu Nghiên cứu về đánh dấu văn bản chữ viết tay tiếng Việt với giải thuật Dynamic Time Warping

.PDF

111

374

70

sourismortechannel

sourismortechannel Báo vi phạm

Tải xuống 70

Mô tả:

Các văn bản giấy trong các thư viện truyền thống dần được thay thế bởi cáctài liệu dạng tệp số, lưu trữ trong ổ cứng máy tính với nhiều định dạng như: .doc,.pdf... Trong quá trình số hóa, có rất nhiều văn bản viết tay lâu năm như: di chúccủa chủ tịch Hồ Chí Minh, bản thảo tập thơ viết tay Hoa Lúa của Thi sĩ Hữu Loan...với mong muốn giữ trọn giá trị nguyên văn của các tác phẩm này và khai thác đượcgiá trị nội dung, lưu trữ sao cho phù hợp với nhu cầu lập chỉ mục và tìm kiếm làmột thách thức lớn đặt ra. Trước mắt người ta chỉ có thể lưu giữ các ảnh thông quaviệc scan từng trang tài liệu. Nói một cách khác, đó là quá trình thủ công sao chépy văn từ tài liệu giấy vào máy tính được thực hiện bởi bàn tay con người. Vì vậy,nguồn tài nguyên bỏ ra về thời gian và tiền bạc để thực hiện công việc này là rấtđắt đỏ.Trong nghiên cứu này, đề xuất sử dụng một phương pháp tiếp cận; đó là đánhdấu từ Word Spotting trong tài liệu tiếng Việt viết tay. Đầu tiên, phải chuyển tấtcả hình ảnh văn bản viết tay về dạng nhị phân (trắng và đen) bằng phương phápphân ngưỡng với giá trị ngưỡng thích hợp. Tiếp đến, bằng các bộ lọc đơn giản nhưlọc trung vị 20 để khữ các nhiễu muối tiêu, các vết bẩn và vết mực mờ 33 34.Dựa vào độ đo của giải thuật Dynamic Time Warping mà phân cụm với số kcụm(tùy chọn) với phương thức gom cụm kmedoids. Kết quả của quá trình gom cụm,sẽ nhận được kcụm tượng trưng cho k mẫu unigram từ; giá trị trọng tâm centroidscủa mỗi mẫu sẽ được sử dụng cho quá trình so khớp (matching) của các nghiêncứu sau đó.

- Xem thêm -

ads

ads

ads

Tài liệu liên quan

thumb

Nghiên cứu thực trạng ô nhiễm nước làng nghề cơ kim ...

73

78979

167

thumb

Nghiên cứu và ứng dụng phương pháp đặc tả phần mềm b...

108

77126

178

thumb

Dáng điệu tiệm cận của họ các toán tử tiến hóa bị nh...

66

76003

156

thumb

Mô hình cơ sở dữ liệu phân tán và áp dụng vào bài to...

59

69160

180

thumb

Một số mô hình cơ sở dữ liệu mở rộng...

72

67416

123

thumb

Một số thuật toán khai phá luật dãy và ứng dụng thử ...

60

65768

162

thumb

Hiệu ứng sinh đa exciton trong pin mặt trời chấm lượ...

55

64434

182

thumb

Nghiên cứu phương pháp làm tăng chất lượng phân lớp ...

55

62550

158

thumb

Nâng cao chất lượng hệ thống nhập dữ liệu tự động th...

68

60135

171

thumb

Nghiên cứu một số vấn đề về phụ thuộc dữ liệu và kha...

74

60058

123

thumb

Khám phá tương tác trội nhờ phương pháp tối ưu đàn k...

66

59541

181

thumb

Nghiên cứu giải pháp đảm bảo an toàn và bảo mật cho ...

78

59279

130

thumb

Nghiên cứu cải tiến hiệu suất cấp phát kênh tần số m...

27

58959

185

thumb

Nghiên cứu chế tạo khuyếch đại quang bán dẫn trên cơ...

78

51046

150

thumb

Nghiên cứu màng mỏng la0.7 sr0.3 mno3 kích thước nan...

67

50466

195

thumb

Cứu và ứng dụng vài mô hình học máy trong việc hỗ tr...

82

50347

132

thumb

Các yếu tố ảnh hưởng đến sự gắn kết của nhân viên tạ...

106

44576

108

thumb

Nghiên cứu quá trình đảo từ cảm ứng bởi điện trường ...

63

43899

89

thumb

Kỹ thuật giấu tin trong ảnh và nghiên cứu khả năng c...

88

38960

101

thumb

Nghiên cứu Luật kết hợp và thử nghiệm khai phá cơ sở...

75

37763

99

ads

ads

ads

Tài liệu vừa đăng

Ứng dụng công nghệ tin học và máy toàn đạc điện tử thực hiện công tác đo đạc bản đồ địa chính tờ số 31 tỷ lệ 1 1000 xã nhã lộng huyện phú bình tỉnh thái nguyên

70

32

104

Nghiên cứu một số giải pháp đảm bảo an ninh và xác thực trong tích hợp người dùng đa miền dịch vụ của cổng thông tin điện tử viện khoa học xã hội quốc gia lào

1

149

Nghiên cứu phương pháp tăng cường chất lượng ảnh vân tay

67

52

102

Nghiên cứu phương pháp phát hiện biên ảnh mầu bằng wavelet

73

54

52

Xây dựng vùng đệm trong hệ thống thông tin địa l ý sử dụng logic mờ

79

54

81

Nghiên cứu thiết kế ứng dụng khóa điện tử đảm bảo an toàn thông tin trong các giao dịch

96

29

132

Xử lý bài toán thêm dấu cho tiếng việt không dấu dựa trên nghiên cứu mô hình ngôn ngữ n_gram

72

24

141

Nghiên cứu thuật toán giấu tin mật trên miền không gian của ảnh bitmap

68

16

123

Nghiên cứu tìm hiểu chuẩn chứ ký số dss và ứng dụng trong chính phủ điện tử

77

15

122

Tích hợp ý kiến ngôn ngữ và xác định độ nhất trí của nhóm chuyên gia ứng dụng trong đánh giá giáo dục

64

14

109

Tài liệu xem nhiều nhất

Nghiên cứu thực trạng ô nhiễm nước làng nghề cơ kim khí phía Nam Hà Nội và đề xuất giải pháp giảm thiểu

73

78979

167

Nghiên cứu và ứng dụng phương pháp đặc tả phần mềm bằng ví dụ trong phát triển phần mềm

108

77126

178

Dáng điệu tiệm cận của họ các toán tử tiến hóa bị nhiễu và một vài ứng dụng

66

76003

156

Mô hình cơ sở dữ liệu phân tán và áp dụng vào bài toán quản lý đào tạo

59

69160

180

Một số mô hình cơ sở dữ liệu mở rộng

72

67416

123

Một số thuật toán khai phá luật dãy và ứng dụng thử nghiệm vào hệ thống quản lý khách hàng và tính hóa đơn nước

60

65768

162

Hiệu ứng sinh đa exciton trong pin mặt trời chấm lượng tử

55

64434

182

Nghiên cứu phương pháp làm tăng chất lượng phân lớp câu hỏi trong hệ thống hỏi đáp

55

62550

158

Nâng cao chất lượng hệ thống nhập dữ liệu tự động theo FORM

68

60135

171

Nghiên cứu một số vấn đề về phụ thuộc dữ liệu và khai phá dữ liệu trong cơ sở dữ liệu quan hệ

74

60058

123