DBScan

Implementação do algoritmo de mineração de dados DBScan. Incluindo 3 medidas de similaridade: Euclidiana, Jaccard e Fading.

##Get started

1 - Baixe este projeto.

2 - Coloque o caminho do seu arquivo de entrada.

    with open('tweets_30.tsv') as json_data:

3 - Escolha o formato do seu arquivo de entrada(JSON ou algum arquivo .txt dividido por algum caracter)

    # A linha abaixo le um arquivo em formato JSON
    # points = json.load(json_data)
    
    # O codigo abaixo le um arquivo txt(tabulado)
    points = {}
    points['tweets'] = []
    for line in json_data:
        data = line.split('\t')

4 - Configure os parâmetros do algoritmo (eps e minPts)

    # A funcao DBSCAN recebe um array de pontos, eps e minPoints.
    dbScan(points['tweets'], 0.3, 500)

5 - Coloque o caminho do seu arquivo de saída.

    # Caminho do arquivo de saida dos clusters
    output_file = open('/Users/CAMINHO/DO/SEU/ARQUIVO/file.txt','a')

6 - Salve as edições.

7 - Abra o console e execute "python DBSCAN.py"

Observações

O código está todo comentádo, a fim de facilitar a edição do mesmo.
Esse projeto possui 3 implementações de medida de similaridade. Euclidiana, Fading e de Jaccard.

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
DBSCAN.py		DBSCAN.py
LICENSE		LICENSE
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

DBScan

Observações

About

Uh oh!

Releases

Packages

Languages

License

gustavomts/DBScan

Folders and files

Latest commit

History

Repository files navigation

DBScan

Observações

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages