Ir para o conteudo

Wikidata

Origem: Wikipedia, a enciclopedia livre.
Wikidata
Pagina principal do Wikidata
Tipo de sitio
Proprietario(s)Fundacao Wikimedia
Requer pagamento?Nao
Idioma(s)Multilingue
Lancamento29 de outubro de 2012[1]
DesenvolvedorComunidade Wikimedia
Endereco eletronicowww.wikidata.org
Licenca
  • CC0
  • CC-BY-SA 4.0

O Wikidata e um projeto da Fundacao Wikimedia que visa fornecer uma base de dados editada colaborativamente para oferecer suporte para projetos tais como a Wikipedia. O Wikidata foi lancado em 30 de outubro de 2012.[2][3] O projeto foi iniciado pela Wikimedia Deutschland e pretender fornecer uma origem comum de certos tipos de dados, como por exemplo, datas de nascimento, uma classe de dados validados, que possa ser utilizada pelos projetos da Wikimedia operando de forma similar ao funcionamento do Wikimedia Commons para imagens e outros tipos de midia.[2][4] Este foi o primeiro novo projeto da Wikimedia Foundation desde 2006.[5]

A criacao do projeto foi financiada por doacoes do Allen Institute for Artificial Intelligence, da Gordon and Betty Moore Foundation, e do Google, Inc., totalizando 1,3 milhao de euros.[6][7]

Em dezembro de 2015, de acordo com as estatisticas da Wikimedia, metade das informacoes no Wikidata nao tinha fontes. Outros 30% sao marcados como provenientes da Wikipedia.[8]

A Biblioteca do Congresso rastreia os itens da plataforma, aumentando significantemente a credibilidade dos dados. Recebe tambem ajuda da Association of Research Libraries, Federacao Internacional de Associacoes e Instituicoes Bibliotecarias e do Program for Cooperative Cataloging.[9] Tambem foram desenvolvidos codigos para a deteccao automatica de vandalismos.[10]

Ver tambem

[editar | editar codigo]

Referencias

  1. | <>. www.wikidata.org. Consultado em 31 de outubro de 2023
  2. | a b Wikidata( Arquivado outubro 30, 2012 no WebCite )
  3. | wikidata.org is live (with some caveats)
  4. | <>. Wikimedia Deutschland. 30 de marco de 2012. Consultado em 11 de setembro de 2012. Arquivado do original em 11 de setembro de 2012
  5. | Roth, Matthew (30 de marco de 2012). <>. Wikimedia Foundation. Consultado em 11 de setembro de 2012. Copia arquivada em 11 de setembro de 2012
  6. | Dickinson, Boonsri (30 de marco de 2012). <>. Business Insider. Consultado em 11 de setembro de 2012. Copia arquivada em 11 de setembro de 2012
  7. | Perez, Sarah (30 de marco de 2012). <>. TechCrunch. Consultado em 11 de setembro de 2012. Copia arquivada em 11 de setembro de 2012
  8. | Kolbe, Andreas (8 de Dezembro de 2015). <> (em ingles). The Register
  9. | Will Kent (3 de junho de 2019). <>. wikiedu.org (em ingles). Consultado em 16 de marco de 2022. Copia arquivada em 16 de marco de 2022
  10. | <> (em ingles). The University of Edinburgh. 27 de agosto de 2021. Consultado em 16 de marco de 2022

Ligacoes externas

[editar | editar codigo]
Este artigo sobre a Wikimedia ou um dos seus projectos e um esboco. Voce pode ajudar a Wikipedia expandindo-o.
Wikipedia
Outros projetos
Pessoas
Comunidade
Por pais
Acesso movel
Uso de conteudo
Restricao por pais
*Mantido atualmente pela Wikimedia Deutschland.
Este diagrama mostra os termos mais importantes usados no Wikidata.

O Wikidata e um banco de dados orientado a documentos, com foco em itens que representam qualquer tipo de topico, conceito ou objeto. Cada item recebe um identificador persistente unico chamado de seu QID, um numero inteiro positivo prefixado com a letra maiuscula "Q" [a]. Com isso, e possivel fazer traducoes das informacoes basicas que descrevem o topico que cada item abrange, sem privilegiar nenhum idioma especifico.

Exemplos de itens e seus QIDs: Jogos Olimpicos de Verao de 1988 (Q8470), amor (Q316), Johnny Cash (Q42775), Elvis Presley (Q303) e Gorila (Q36611).

Os rotulos dos itens nao precisam ser exclusivos. Por exemplo, existem dois itens chamados "Elvis Presley": Elvis Presley (Q303), que representa o cantor e ator americano, e Elvis Presley (Q610926), que representa seu album homonimo. No entanto, a combinacao de um rotulo e sua descricao deve ser exclusiva. Para evitar ambiguidade, o QID de um item e vinculado a essa combinacao.

Partes principais

[editar | editar codigo]


Um layout dos quatro componentes principais de uma pagina Wikidata da fase 1: o rotulo, a descricao, os aliases e os links interlinguisticos

Fundamentalmente, um item consiste em:

  • Um identificador (o QID), relacionado a um rotulo e uma descricao.
  • Opcionalmente, varios aliases e algumas instrucoes (e suas propriedades e valores).

Declaracoes

[editar | editar codigo]
Tres afirmacoes do item do Wikidata sobre o planeta Marte (Q111). Os valores incluem links para outros itens e para o Wikimedia Commons .

Declaracoes sao como qualquer informacao conhecida sobre um item e registrada no Wikidata. Formalmente, elas consistem em pares chave-valor, que correspondem a uma propriedade (como "autor" ou "data de publicacao") com um ou mais valores de entidade (como " Sir Arthur Conan Doyle " ou "1902"). Por exemplo, a declaracao informal em ingles "milk is white" (leite e branco, em traducao livre) seria codificada por uma declaracao que emparelha a propriedade cor (P462) com o valor branco (Q23444) sob o item leite (Q8495).

As declaracoes podem mapear uma propriedade para mais de um valor. Por exemplo, a propriedade "ocupacao" de Marie Curie poderia ser vinculada aos valores "fisica" e "quimica", para refletir o fato de que ela se dedicava a ambas as ocupacoes. [2]

Os valores podem assumir varios tipos, incluindo outros itens do Wikidata, strings, numeros ou arquivos de midia. As propriedades prescrevem com quais tipos de valores eles podem ser pareados. Por exemplo, a propriedade sitio oficial (P856) so pode ser pareada com valores do tipo "URL". [3]

De forma opcional, qualificadores podem ser usados para refinar o significado de uma declaracao, fornecendo informacoes adicionais. A titulo de ilustracao, uma declaracao "populacao" pode ser modificada com um qualificador como "ponto no tempo (P585): 2011" (como seu proprio par chave-valor). Os valores nas declaracoes tambem podem ser anotados com referencias, apontando para uma fonte que respalde o conteudo da declaracao. [4] Assim como nas declaracoes, todos os qualificadores e referencias sao pares propriedade-valor.

Propriedades

[editar | editar codigo]
Exemplo de uma declaracao simples que consiste em um par propriedade-valor

Cada propriedade possui um identificador numerico prefixado com P maiusculo e uma pagina no Wikidata com rotulo, descricao, aliases e instrucoes opcionais. Assim, existem propriedades com o unico proposito de descrever outras propriedades, como subpropriedade de (P1647).

Propriedades tambem podem definir regras mais complexas sobre seu uso pretendido, denominadas restricoes. Por exemplo, a propriedade capital (P36) inclui uma "restricao de valor unico", refletindo a realidade de que (tipicamente) territorios possuem apenas uma capital. Restricoes sao tratadas como alertas e dicas de teste, em vez de regras inviolaveis. [5]

Para uma a criacao de uma nova propriedade, e necessario um processo de discussao entre a comunidade. [6] [7]

Das atuais propriedades, a mais usada e cita (P2860), que e usada em mais de 290.000.000 de paginas de itens Desde novembro de 2023 (2023 -11)[update]. [8]

Entrada do lexema Klingon do Wikidata

Em linguistica, um lexema e uma unidade de significado lexical que representa um grupo de palavras que compartilham o mesmo significado central e caracteristicas gramaticais. [9] [10] Da mesma forma, os lexemas do Wikidata sao itens com uma estrutura que os torna mais adequados para armazenar dados lexicograficos. Desde 2016, o Wikidata oferece suporte a entradas lexicograficas na forma de lexemas. [11]

No Wikidata, as entradas lexicograficas tem um identificador diferente das entradas de itens regulares. Essas entradas sao prefixadas com a letra L, como nas entradas de exemplo para livro e vaca. As entradas lexicograficas no Wikidata podem conter declaracoes, sentidos e formas. [12] O uso de entradas lexicograficas no Wikidata permite a documentacao do uso de palavras, a conexao entre palavras e itens no Wikidata, traducoes de palavras e ativa dados lexicograficos legiveis por maquina.

Em 2020, as entradas lexicograficas no Wikidata ultrapassaram 250.000. O idioma com mais entradas lexicograficas foi o russo, com 101.137 lexemas, seguido pelo ingles, com 38.122 lexemas. Existem mais de 668 idiomas com entradas lexicograficas no Wikidata. [13]

Esquemas de entidade

[editar | editar codigo]
Esquema de entidade humana no Wikidata

No Wikidata, um esquema e um modelo de dados que descreve os atributos necessarios para um item de dados. [14] Por exemplo, um item de dados que usa o atributo "instancia de" com o valor "humano" normalmente incluiria atributos como "local de nascimento", "data de nascimento", "data de falecimento" e "local de falecimento". [15] O esquema de entidade no Wikidata utiliza Shape Expression (ShEx) para descrever os dados em itens do Wikidata na forma de um Resource Description Framework (RDF). [16] O uso de esquemas de entidade no Wikidata ajuda a resolver inconsistencias de dados e vandalismo descontrolado. [14]

Janeiro de 2019 marcou o inicio do desenvolvimento de uma nova extensao para o MediaWiki, para permitir o armazenamento de ShEx em um namespace separado. [17] [18] Os esquemas de entidade sao armazenados com identificadores diferentes daqueles usados para itens, propriedades e lexemas. Os esquemas de entidade sao armazenados com um identificador "E", como E10 para o esquema de entidade de instancias de dados humanos e E270 para o esquema de entidade de instancias de dados de construcao. Esta extensao foi instalada no Wikidata [19] e permite que os contribuidores usem ShEx para validar e descrever dados do Resource Description Framework em itens e lexemas. Qualquer item ou lexema no Wikidata pode ser validado em relacao a um esquema de entidade, e isso o torna uma ferramenta importante para garantia de qualidade.

  1. | Vrandecic, Denny; Pintscher, Lydia; Krotzsch, Markus (30 April 2023). <>. Companion Proceedings of the ACM Web Conference 2023. [S.l.: s.n.] pp. 615-624. ISBN 9781450394192. doi:10.1145/3543873.3585579 Verifique data em: |data= (ajuda)
  2. | <>. www.wikidata.org. Consultado em 20 February 2019. Arquivado do original em 25 March 2019 Verifique data em: |acessodata=, |arquivodata= (ajuda)
  3. | <>. www.wikidata.org. Consultado em 20 February 2019. Arquivado do original em 23 March 2019 Verifique data em: |acessodata=, |arquivodata= (ajuda)
  4. | <>. www.wikidata.org. Consultado em 20 February 2019. Arquivado do original em 17 April 2019 Verifique data em: |acessodata=, |arquivodata= (ajuda)
  5. | <>. Wikidata. Consultado em 20 February 2019. Arquivado do original em 1 June 2019 Verifique data em: |acessodata=, |arquivodata= (ajuda)
  6. | Cochrane, Euan (30 September 2016). <>. openpreservation.org. Consultado em 5 January 2022. Arquivado do original em 5 January 2022 Verifique data em: |acessodata=, |arquivodata=, |data= (ajuda)
  7. | Samuel, John (15 August 2018). Experimental IR Meets Multilinguality, Multimodality, and Interaction. CLEF 2018. Lecture Notes in Computer Science. 11018. p. 129. ISBN 978-3-319-98931-0. doi:10.1007/978-3-319-98932-7_12 Verifique data em: |data= (ajuda)
  8. | <>. Consultado em 18 November 2023. Arquivado do original em 24 February 2023 Verifique data em: |acessodata=, |arquivodata= (ajuda)
  9. | Andreou, Marios (27 de marco de 2019), <>, ISBN 978-0-19-977281-0, Oxford University Press, Linguistics (em ingles), doi:10.1093/obo/9780199772810-0232, consultado em 17 de agosto de 2024 Parametro desconhecido |dataarquivo= ignorado (ajuda)
  10. | Bonami, Olivier; Boye, Gilles; Dal, Georgette; Giraudo, Helene; Namer, Fiammetta (23 de agosto de 2018). The Lexeme In Descriptive And Theoretical Morphology. [S.l.]: Language Science Press. doi:10.5281/zenodo.1402520
  11. | Nielsen, Finn Arup (2019), Hitzler, Pascal; Kirrane, Sabrina; Hartig, Olaf; de Boer, Victor, eds., <>, ISBN 978-3-030-32326-4, Cham: Springer International Publishing, The Semantic Web: ESWC 2019 Satellite Events, Lecture Notes in Computer Science (em ingles), 11762: 141-146, doi:10.1007/978-3-030-32327-1_28, consultado em 17 de agosto de 2024
  12. | <>. www.wikidata.org. Consultado em 13 November 2018. Arquivado do original em 13 November 2018 Verifique data em: |acessodata=, |arquivodata= (ajuda)
  13. | Nielsen, Finn (May 2020). Ionov, Maxim; McCrae, John P.; Chiarcos, Christian; Declerck, Thierry; Bosque-Gil; Gracia, Jorge, eds. <>. Marseille, France: European Language Resources Association. Proceedings of the 7th Workshop on Linked Data in Linguistics (LDL-2020) (em ingles): 82-86. ISBN 979-10-95546-36-8 Verifique data em: |data= (ajuda)
  14. | a b Werkmeister, Lucas (2018). Schema Inference of Wikidata (PDF) (em ingles). Karlsruhe: Fakultat fur Informatik, Karlsruhe Institute of Technology
  15. | Erxleben, Fredo; Gunther, Michael; Krotzsch, Markus; Mendez, Julian; Vrandecic, Denny (2014), <>, ISBN 978-3-319-11963-2, Cham: Springer International Publishing, Lecture Notes in Computer Science: 50-65, doi:10.1007/978-3-319-11964-9_4, consultado em 18 de agosto de 2024
  16. | Thornton, Katherine; Solbrig, Harold; Stupp, Gregory S.; Labra Gayo, Jose Emilio; Mietchen, Daniel; Prud'hommeaux, Eric; Waagmeester, Andra (2019), Hitzler, Pascal; Fernandez, Miriam; Janowicz, Krzysztof; Zaveri, Amrapali, eds., <>, ISBN 978-3-030-21347-3, Cham: Springer International Publishing, The Semantic Web (em ingles), 11503: 606-620, doi:10.1007/978-3-030-21348-0_39 Parametro desconhecido |dataarquivo= ignorado (ajuda)
  17. | <>. mediawiki.org. Consultado em 10 September 2021. Arquivado do original em 25 June 2021 Verifique data em: |acessodata=, |arquivodata= (ajuda)
  18. | <>. Gerrit. 15 January 2019. Consultado em 12 June 2022. Arquivado do original em 19 March 2022 Verifique data em: |acessodata=, |arquivodata=, |data= (ajuda)
  19. | <>. Wikidata.org. Consultado em 10 September 2021. Arquivado do original em 19 October 2021 Verifique data em: |acessodata=, |arquivodata= (ajuda)


Erro de citacao: Existem etiquetas para um grupo chamado "lower-alpha", mas nao foi encontrada nenhuma etiqueta correspondente