Bài viết chuyên sâu

Kho dữ liệu số, dữ liệu bản đồ vệ tinh, dữ liệu liên quan tới dân số Việt, dữ liệu ảnh mặt người, ảnh đồ vật, dữ liệu ...mọi mặt:

Kho dữ liệu số, dữ liệu bản đồ vệ tinh, dữ liệu liên quan tới dân số Việt, dữ liệu ảnh mặt người, ảnh đồ vật, dữ liệu ...mọi mặt:

by Admin Dathoc -
Number of replies: 0

Kho dữ liệu số, dữ liệu bản đồ vệ tinh, dữ liệu liên quan tới dân số Việt, dữ liệu ảnh mặt người, ảnh đồ vật, dữ liệu ...mọi mặt:

Thông thường bạn vào kaggle.com, xong nếu đặc thù hơn bạn vào:


1.  Từ chính thống gov VietNam

https://open.data.gov.vn/

https://opendata.hochiminhcity.gov.vn/

(thông thường nguồn này ít số liệu, chỉ là thông báo, bố cáo, báo chí)


2. Dân số, và liên quan dân số

https://data.humdata.org/dataset/vietnam-high-resolution-population-density-maps-demographic-estimates

https://populationstat.com/vietnam/

https://data.humdata.org/group/vnm

https://energydata.info/dataset/vietnam--population-density-2015/resource/89c7613c-b164-486d-9d0d-dec96d99ecb9?inner_span=True


3. Hình ảnh bản đồ từ vệ tinh, mọi nơi (ngoài Bing, Google Map, Here)

Lấy toàn bộ ảnh của Apple map:

https://github.com/Jimut123/jimutmap

Từ server Arcgis (đang miễn phí) qua USGS Earth Explorer này, cũng lại bắt đc url argis và lọc theo latlong:

https://earthexplorer.usgs.gov/

European Space Agency: Sentinel-2, tất nhiên phải lọc ra mới có ảnh ngã tư

http://www.esa.int/.../Observing.../Copernicus/Sentinel-2

Từ Nasa Earth, cũng phải tìm url get từng title lấy và lọc theo toạ độ

https://search.earthdata.nasa.gov/search

Từ AWS các dự án free và họ có sẵn ảnh sattelite, phải search tên dự án hoặc: Landsat, Sentinel-2, MODIS, Terrain Tiles

https://aws.amazon.com/public-datasets/

Một số source khác:

https://gisgeography.com/free-satellite-imagery-data-list/


4. Hình ảnh mặt người Việt

http://afad-dataset.github.io/

Tool tự động search tự động lấy

https://www.youtube.com/watch?v=lLDrUuw1RHc&t=3s

Ảnh từ asia face

http://afad-dataset.github.io/

https://github.com/deepinsight/insightface/wiki/Dataset-Zoo

https://htsuda.net/archives/317

http://vis-www.cs.umass.edu/lfw/


5. Dữ liệu bản đồ title, vẽ hình

https://data.humdata.org/search?q=geodata

https://data.maptiler.com/downloads/planet/

https://opendata.hcmgis.vn/

http://freegisdata.org/place/237281/

https://www.facebook.com/GisVietNamGeoraphicInformationSystemVietNam/

http://www.geoviet.vn/tu-lieu-nguon/en/436/285/baiviet/0/gis-data-and-maps.aspx


6. Dữ liệu đi lại grab, kèm sự lan toả covid tháng 3/2020

http://dathoc.net/covidvn.html


7. Realtime GDP,  social media info

https://www.worldometers.info/


8.  Dữ liệu ảnh XQuang cho chẩn đoán Y học

Bộ sưu tập đủ loại cancer tới các loại sỏi đá kim cương trong cơ thể
https://www.cancerimagingarchive.net/collections/
Có điểm rất hay là nguồn này nó có phần view xray rất cool, zoom, xoay, chỉnh sáng xem như trong bệnh viện ý!

Sưu tập của NIHCC mà Google vẫn share cho all
https://nihcc.app.box.com/v/ChestXray-NIHCC

Sưu tập 5K xray dataset cho Covid:
https://www.dropbox.com/s/9w8nmj791c9ogsx/data_upload_v3.zip?dl=0

15k xray ngực phổi từ Vingroup
https://www.kaggle.com/c/vinbigdata-chest-xray-abnormalities-detection/data

1k3 xray covid
https://www.kaggle.com/c/dlai3/data

3k8 xray covid
https://www.kaggle.com/tawsifurrahman/covid19-radiography-database

Xray covid lẻ tẻ khác
200 img: https://github.com/ieee8023/covid-chestxray-dataset
90 img: https://www.kaggle.com/alifrahman/covid19-chest-xray-image-dataset

12k xray xương và đổ tuổi
https://www.kaggle.com/kmader/rsna-bone-age

Chẩn xương loãng
https://biomedpharmajournal.org/vol12no1/xsitray-a-database-for-the-detection-of-osteoporosis-condition/

116 xray răng
https://data.mendeley.com/datasets/hxt48yk462/2

Model răng
https://github.com/clemkoa/tooth-detection

9. Dữ liệu voice audio Việt cho luyện speech to text


Vietnamese Speech Recognition Corpus- (Mobile)- 144 Speaker - 76.6 hours by Speechocean (2017) data $

https://www.kaggle.com/flightstar/vn-vn-dataset


Vietnamese Speech Recognition Corpus-(In-Car)-300 Speakers - 305 hours by Speechocean (2017) data $

(lost)https://kingline.speechocean.com/exchange.php?id=3333&act=view


Globalphone Vietnamese - 22.5 hours of read speech from 15 Vietnamese online newspapers by ELRA (2012) data $

http://catalog.elra.info/en-us/repository/browse/ELRA-S0322/


VIVOS - a free Vietnamese speech corpus consisting of 15 hours of recording speech by AILab (2017) data

https://ailab.hcmus.edu.vn/vivos


Tone VN songs melody

https://datashare.ed.ac.uk/handle/10283/2047


10. Dữ liệu biểu mẫu cho thực thi 6 sigma, kiểm soát chất lượng, tính dòng tiền, công thức cân đối nợ tài chính...

https://exinfm.com/free_spreadsheets.html

https://exinfm.com/six_sigma_project_files.html

https://exinfm.com/training/miscfiles.html

https://exinfm.com/board/index.html


https://www.mic.gov.vn/mra/Pages/TinTuc/134582/Danh-muc-Tieu-chuan-quoc-gia-linh-vuc-Thong-tin-va-Truyen-thong.html


http://www.cadivi-vn.com/vn/chung-nhan-chat-luong-1569572192.html


https://www.tutorialspoint.com/cmmi/cmmi-maturity-levels.htm

http://itq.ch/pdf/sqm/sqm_ochs_SiemensMetrics.pdf