поиск дублей | Community Creatio

30 октября 2020 14:42

На сегодняшний день при настройке правил поиска дублей можно использовать только строковые и справочные поля. Хотелось бы, чтобы такая возможность была и для полей с типом 'Дата'.

Была бы благодарна за поддержку этой идеи и фидбек других участников community по поводу настройки правил поиска дублей.

Поделитесь, возникала ли у Вас потребность при настройке правил поиска дублей использовать другие типы, например, 'Даты' или числа?

Понравилась ли вам эта идея?

8 комментариев

Владимир Соколов

30 октября 2020 15:02

Чтобы искать по дню рождения?

Ответить

30 октября 2020 16:09

Владимир Соколов,

Да, если речь идет о контактах.

Также может быть дата подписания или дата подключения.

Ответить

30 октября 2020 21:24

Алла, идея иметь возможность искать дубли по типу данных «дата» уже зафиксирована. Спасибо за проявленный интерес к развитию платформы.

Ответить

31 октября 2020 03:13

Зверев Александр,

А мне в поддержке ответили, что ранее таких запросов от клиентов не поступало. Вот я и решила узнать, насколько это редкий кейс.

Ответить

2 ноября 2020 12:54

Алла, это достаточно редкое пожелание. Идея зафиксирована, но планов реализации в конкретных версиях пока нет.

Ответить

3 ноября 2020 16:58

Зверев Александр,

Знаешь, у меня сложилось ощущение, что большинство пользователей уже махнуло рукой на озвучивание своих пожеланий, которые могут быть реализованы никогда в одной из версий в 22 веке))) и каждый прикручивает свой костыль(

Ответить

Владимир Соколов

3 ноября 2020 17:30

Алла Савельева пишет:

большинство пользователей уже махнуло рукой на озвучивание своих пожеланий

Надо продолжать. Во-первых, 22-й век наступит. Во-вторых, может быть, кто-то расскажет, как делал свой костыль :)

Ответить

Не коректно работает поиск дублей лидов в детали Похожие лиды.

3 ноября 2020 17:42

Или даст ссылку на маркет, где уже есть такое дополнение. Может, даже бесплатное.

Вчера по одной пятилетней идее такое нашёл.

Ответить

Показать все комментарии

ПОИСК_ДУБЛЕЙ_ЛИДОВ

поиск дублей

Похожие_лиды

7.15

Sales_Creatio

_Misha_

29 июля 2020 17:22

Здравствуйте,

столкнулся с проблемой в детали Похожие лиды,

какие бы правила не включал, или даже выключал все, все равно работает сравнение по полю - Контрагент.

остальные правила работаю тоже, если их включить, но сравнение по Контрагенту всегда включено, хотя в правиле его нет.

Суппорт подсказал только что должна использоваться процедура - tsp_FindLeadSimilarRecords, я внес в нее правки в базу, логирование на вызов, но она не вызываеться :(

пробовал отключить все существующие правила, и создать свое по процедуре, используя статью: https://academy.terrasoft.ru/documents/technic-sdk/7-16/dobavlenie-pravila-massovogo-poiska-dubley

настроил вызов все той же - tsp_FindLeadSimilarRecords, но процедура все равно не вызываеться.

может у кого то есть идеи как решить проблему?

Нравится

1 комментарий

Поиск дублей при сохранении

30 июля 2020 11:26

Похожий случай недавно обсуждали тут, возможно, у Вас причина та же самая.

Механизмы поиска дублей неоднократно менялись в зависимости от версии системы, в последних версиях для него используется движок глобального поиска.

В статье по Вашей ссылке отмечено:

Описанный процесс добавления правила массового поиска дублей актуален для Creatio версий 7.13.2 и ниже. Для версий системы 7.13.4 и выше функциональность поиска дублей описана в статье “Поиск и объединение дублей”, а работа с правилами поиска дублей при сохранении записи — в статье "Добавление правила поиска дублей при сохранении записи".

Проверьте, может, для Вашей версии настраивается иначе, не правкой хранимки.

Ответить

Показать все комментарии

поиск дублей

7.16

7 июля 2020 15:17

Здравствуйте! На 7.16.1 необходимо настроить поиск дублей в Контрагенте по кастомному полю (ИНН). Добавил хранимую процедуру и зарегистрировал её, как описано в данной статье: https://academy.terrasoft.ru/documents/technic-sdk/7-11/dobavlenie-pravila-poiska-dubley?_ga=2.85605657.1051876412.1592819009-1256785345.1592483512. Установил признак "Использовать при сохранении", но при сохранении не отрабатывает, хотя при массовом поиске дубли находит. При этом стандартные правила отрабатывают при сохранении, если включить этот признак.

Название кастомного поля: InfTIN

Ссылка на код процедуры: https://pastebin.com/Gwir4eDg

Ссылка на код регистрации правила: https://pastebin.com/L9uVR8kR

Нравится

11 комментариев

8 июля 2020 18:23

Константин, на первый взгляд, Ваши хранимки отличаются от примера только названиями полей. Но это инструкция к 7.11, это очень старая версия. Сейчас функциональность поиска дублей завязана на на работу сервиса глобального поиска.

Что интересно, если в Вашей ссылке поменять версию на 7.16, заголовок сменится на Добавление правила массового поиска дублей | Creatio Academy и содержит примечание:

Описанный процесс добавления правила массового поиска дублей актуален для Creatio версий 7.13.2 и ниже. Для версий системы 7.13.4 и выше функциональность поиска дублей описана в статье “Поиск и объединение дублей”, а работа с правилами поиска дублей при сохранении записи — в статье "Добавление правила поиска дублей при сохранении записи".

Поскольку у Вас 7.16.1, эта статья не подходит, выберите подходящую статью.

Ответить

8 июля 2020 21:41

Зверев Александр,

В самом начале данной статьи есть предупреждение:

Описанный процесс добавления правила поиска дублей актуален для Creatio версий 7.13.2 и ниже. Для версий системы 7.13.4 и выше функциональность поиска дублей описана в статье “Поиск и объединение дублей”, а работа с правилами массового поиска дублей — в статье "Добавление правила массового поиска дублей".

При этом процедура работает, похожа на стандартные процедуры, которые работают при сохранении, при установке признака "Использовать при сохранении".

Не хотелось бы завязывать поиск дублей на функциональности для версий 7.13.2 и ниже, ведь если в последующих обновлениях её поправят, то отвалится поиск дублей.

Ответить

9 июля 2020 09:50

Для версии 7.16 поиск дублей описан в статьях «Как выполнить поиск дублей», «Как работает поиск дублей» и «Правила поиска дублей», там хранимки уже не упоминаются. Уверены, что те стандартные способы, с которыми сравниваете, используют такие хранимки?

Ответить

9 июля 2020 10:34

Зверев Александр,

В статье "Правила поиска дублей" описывается достаточно странный процесс, потому что в "Правила поиска дублей" нет кнопки добавить.

При этом, стандартные правила используют такие же хранимые процедуры. Например, правило поиска дублей контрагента по имени: https://pastebin.com/iKnzi8Nm

Кроме того, все правила описаны в таблице DuplicatesRule, которая явно указывает на хранимые процедуры.

Ответить

9 июля 2020 11:47

Судя по результатам выборки, хранимки есть не у всех правил, даже активных.

Ответить

10 июля 2020 10:21

Зверев Александр,

Но по статье для 7.16 необходимо замещение модулей, а с версии 7.13 оно запрещено

Ответить

10 июля 2020 11:18

Где именно? Статья «Добавление правила поиска дублей при сохранении записи», несмотря на адрес с цифрой 16, тоже, похоже, относится к версии до 7.13.2.

По изначальному вопросу: если у Вас 7.16.1, те правила поиска, которые с хранимкой и наподобие которых Вы хотите сделать своё, точно ли отрабатывают или остались от старых версий?

Ответить

10 июля 2020 13:33

Зверев Александр,

Да, я именно про эту статью.

Они, скорее всего, остались от старых версий, но они отрабатывают.

Ответить

10 июля 2020 20:01

В DuplicatesRuleManager в функции проверяются условия для правил:

/// &lt;inheritdoc cref="IDuplicatesRuleManager.GetDuplicatesRules(string)"/&gt;
public IEnumerable&lt;DuplicatesRuleDTO&gt; GetDuplicatesRules(string schemaName) {
	return GetAllDuplicatesRules()
		.Where(rule =&gt; rule.SchemaName == schemaName &amp;&amp;
			(schemaName == LeadSchemaName ? rule.IsActive : rule.UseAtSave) &amp;&amp;
			(string.IsNullOrEmpty(rule.SearchSchemaName) || rule.SearchSchemaName == schemaName));
}

Проверьте, все ли они выполняются для Вашего.

Ответить

15 июля 2020 14:28

Зверев Александр,

А когда вызывается этот класс? При локальном и массовом поиске не получилось просмотреть.

Ответить

Как повлиять на то какой идентификатор оставить при объединении дублей

27 июля 2020 12:40

Функция вызывается из DeduplicationManager:

/// &lt;inheritdoc cref="IDeduplicationManager.FindDuplicates"/&gt;
public DuplicatesCollection FindDuplicates(FindDuplicatesRequest findDuplicatesOnSaveRequest) {
	var timer = new Stopwatch();
	try {
		timer.Start();
		var entityRules = _duplicatesRuleManager
			.GetDuplicatesRules(findDuplicatesOnSaveRequest.SchemaName);
		return FindSimilarRecords(entityRules.ToList(), findDuplicatesOnSaveRequest);
	}
	finally {
		timer.Stop();
		_metricReporter.Gauge(DuplicationSearchDurationMetricName, timer.ElapsedMilliseconds);
	}
}
 
/// &lt;inheritdoc cref="IDeduplicationManager.FindSimilarRecordsFromStored"/&gt;
public DuplicatesCollection FindSimilarRecordsFromStored(FindSimilarRecordsFromStoredRequest request) {
	var entityRules = request.SchemaName == request.SourceSchemaName
		? _duplicatesRuleManager.GetDuplicatesRules(request.SchemaName)
		: _duplicatesRuleManager.GetDuplicatesRules(request.SourceSchemaName, request.SchemaName);
	var searchSimilarRecordsRequest = _findSimilarRecordsRequestBuilder.BuildRequest(request);
	return FindSimilarRecords(entityRules.ToList(), searchSimilarRecordsRequest);
}

Ответить

Показать все комментарии

поиск дублей

объединение

коннектор

7.12

sales_enterprise

Gorbunov Alexander

31 мая 2019 12:19

Здравствуйте, уважаемое сообщество!

В базе имеется много Контрагентов внесённых вручную, сделали интеграцию Контрагентов из 1С при помощи 1С Коннектора, естественно появились дубли

Но заметил, что при объединении дублей остаётся идентификатор старого объекта, а не нового который я выбираю... всё бы ничего но мне нужен новый идентификатор, который был присвоен после интеграции так как по нему идёт связь с Коннектором в таблице SmrSyncHistory для дальнешей синхронизации

Вопрос, как повлиять на то какой объект оставить в системе во время объединения дублей, а какой удалить?

Проверяю следующим запросом к базе:

select * from Account where name = 'Высший Вкус ООО (ВВ)';
select * from SmrSyncHistory where localid in (select id from Account where name = 'Высший Вкус ООО (ВВ)');

До объединения:

После объединения:

Нравится

5 комментариев

Лучший ответ

Трефилов Павел Сергеевич

4 июня 2019 17:45

Gorbunov Alexander, Если акция разовая, то можно сделать апдейт даты в таблице на какую-то более старую.

Ответить

Александр Свистунов

31 мая 2019 12:56

Пока в стандартном механизме платформы нет выбора золотой записи.

В случае использования 1C Connector вы можете сразу настроить признак [Использовать для дедупликации] по полю Название, чтобы дубли вообще не создавались. Подробнее -https://samarasoft.com/docs/1c-connector/integration-setting-bpmonline/fields-mapping/

Ответить

Не работает поиск дублей при сохранении записи

31 мая 2019 13:15

В стандартном механизме в качестве золотой берётся первое значение в коллекции. В схеме DeduplicationMergeHandler функция MergeEntityDublicates начинается так:

public void MergeEntityDublicates(string schemaName, int groupId, List&lt;Guid&gt; duplicateRecordIds, Dictionary&lt;string, string&gt; resolvedConflicts) {
	EntitySchema entitySchema = _userConnection.EntitySchemaManager.GetInstanceByName(schemaName);
	EntityCollection duplicates = GetEntityDublicates(schemaName, duplicateRecordIds);
	Entity goldenEntity = duplicates.FirstOrDefault();
	if (goldenEntity == null) {
		return;
	}
	duplicates.RemoveFirst();
	duplicateRecordIds.Remove(goldenEntity.PrimaryColumnValue);
	if (duplicates.Count == 0) {
		return;
	}

А коллекция отсортирована по дате создания, старые вначале:

public EntityCollection GetEntityDublicates(string schemaName, List&lt;Guid&gt; ids, List&lt;string&gt; columns = null) {
	EntitySchema schema = _userConnection.EntitySchemaManager
		.GetInstanceByName(schemaName);
	var esq = new EntitySchemaQuery(schema);
	if (columns == null) {
		esq.AddAllSchemaColumns();
	} else {
		esq.PrimaryQueryColumn.IsAlwaysSelect = true;
		if (!columns.Contains("CreatedOn")) {
			esq.AddColumn("CreatedOn");
		}
		foreach (string columnName in columns) {
			esq.AddColumn(columnName);
		}
	}
	esq.Filters.Add(esq.CreateFilterWithParameters(FilterComparisonType.Equal,
		esq.RootSchema.PrimaryColumn.Name, ids.Cast&lt;object&gt;()));
	EntityCollection entityCollection = esq.GetEntityCollection(_userConnection);
	entityCollection.Order("CreatedOn", OrderDirection.Ascending);
	return entityCollection;
}

Вы можете либо изменить эту логику, но учитывая возможные побочные эффекты, либо же последовать совету Александра, чтобы избежать создания дублей.

Ответить

Gorbunov Alexander

4 июня 2019 17:29

Здравствуйте!

Спасибо за советы, только сейчас пролучилось вернуться к этому кейсу

Я так понимаю что включать признак дедупликации в Коннекторе уже поздно, ну или чистить записи и проводить интеграцию заново

Хочу попробовать сделать по совету Зверева Александра, но не могу найти статью или ответы на комьюнити как правильно замещать "Исходный код", я так понял надо просто поменять Ascending на Descending.

Ответить

Трефилов Павел Сергеевич

4 июня 2019 17:45

Gorbunov Alexander, Если акция разовая, то можно сделать апдейт даты в таблице на какую-то более старую.

Ответить

Gorbunov Alexander

4 июня 2019 17:52

Трефилов Павел Сергеевич,

ОМАЙГАДБЛ... всё гениальное просто, спасибо, попробую ))))))))

Ответить

Показать все комментарии

дубли

поиск дублей

поиск дублей при сохранении

7.13_()

sales_enterprise

2 марта 2019 11:24

Sales Enterprise

Версия 7.13.3.481

Настраиваю новое правило поиска дублей по полю "Основной телефон" согласно инструкции:

https://academy.terrasoft.ru/documents/technic-sdk/7-13/dobavlenie-pravila-poiska-dubley

Признак "Использовать правило при сохранении" установлен: https://yadi.sk/i/546AVOF8xgA95A

Но при создании очевидного дубля по полю основной телефон новая запись благополучно сохраняется.

При запуске глобального поиска дублей поиск по новому правилу отрабатывает корректно.

Нравится

7 комментариев

5 марта 2019 12:29

Вероятно, новое правило было создано неверно. Если самостоятельно разобраться в инструкции не получилось, попробуйте обратиться в техническую поддержку, описав свои шаги подробнее и предоствив доступ к серверу.

Ответить

5 марта 2019 12:32

Правило отрабатывает корректно при глобальном поиске.

Дополнительных настроек кроме признака "Использовать при сохранении" в академии не нашёл.

Ответить

5 марта 2019 12:39

Если бы правило было настроено верно, оно бы отрабатывало везде. Кроме простановки галочки ещё нужно написать хранимую процедуру, о чём написано в инструкции.

Ответить

5 марта 2019 13:13

Так же выявлено, что и базовые правила не отрабатывают при сохранении

Ответить

5 марта 2019 13:30

Базовые правила должны отрабатывать при сохранении контакта и контрагента.

Ответить

5 марта 2019 14:16

О сохранении Контрагента и идёт речь

Ответить

Не работает поиск дублей при сохранении записи

5 марта 2019 14:46

Попробуйте развернуть демо-версию того же продукта и проверить на ней. Если там дубли проверяются, то дело в доработках. Если тоже нет, то сообщите в поддержку.

Ответить

Показать все комментарии

поиск дублей

ошибка

7.12

sales

Подкопаев Михаил Олегович

29 августа 2018 14:23

Перестал работать поиск дублей при сохранении записи "Контакт", "Контрагент", хотя поиск дублей через действия раздела работает корректно.

Признак правила поиска "Использовать правило при сохранении" установлен.

Провел отладку: метод findDuplicates() модуля DuplicatesSearchUtilitiesV2 корректно передает данные в DeduplicationService.FindDuplicatesOnSave()

В свою очередь метод сервиса FindDuplicatesOnSave вызывает метод DeduplicationProcessing.FindDuplicates, из которого идет обращение к хранимой процедуре tsp_FindDuplicates.

Код хранимой процедуры не отличается от кода этой же процедуры на чистой базе.

В результате в callback метод падает пустой массив дублей, хотя в разделе есть полностью аналогичные записи.

В чем может быть проблема? Есть подозрение, что проблема появилась после перехода на версию 7.12

Нравится

2 комментария

Соколов Владимир AVITERRA

30 августа 2018 17:16

Для включения поиска дублей при сохранении необходимо открыть Дизайнер системы -> Правила поиска дублей, выбрать необходимое правило и установить признак Проверять при сохранении.

Рекомендую использовать правила поиска по нескольким полям, это позволит избежать проблем с производительностью и выбором записей при сохранении(меньше записей будет в выборке).

Если это сделано, дело ещё может быть в том, что в разделе Контакты есть несколько карточек редактирования. Работа в таком режиме была исправлена в 7.12.2.

Рекомендуем обновить до версии 7.12.2, после обновления проблема будет решена. А на версии 7.12.3 также работает поиск дублей при сохранении при создании контакта через мини-карточку.

Ответить

4 июня 2022 10:14

Мотков Илья пишет:

Дизайнер системы -> Правила поиска дублей

А что делать, если в дизайнере системы на 7.16 нет "Правила поиска дублей"? Где оно включается?

Ответить

Показать все комментарии

дедубликация

поиск дублей

дубли

Поиск дубликатов

Евгений.

5 февраля 2018 09:53

Коллеги, выручайте. У меня были записи в разделе, которые создали разные контакты, но данные контакты по факту являются дубликатами.

Сделал поиск дубликатов для контактов, объединил найденные дубликаты.

И получилось так, что у части записей затерлось поле "Создал", select возвращает данное поле со старым id создавшего, которого по факту уже нет так-как он объединился.

Как вернуть все обратно? Если возможность посмотреть логи дубликатов?

Я ожидал, что после объединения дубликатов, система сама перезапишет во всех записях поле создал на новый id.

Нравится

1 комментарий

Арменчу Артём Александрович

5 февраля 2018 10:46

Добрый день!

Дедупликация записи - это не создание новой.

Фактически, Вы удаляете одну из записей, и обновляете значения оставшейся.

Вернуть результат дедупликации пользовательскими средствами нельзя.

Вы можете поднять бэкап БД до обновления и перенести значения CreatedBy при помощи запроса в БД.

Ответить

Показать все комментарии

поиск дублей

Технические вопросы

7.x

Правила поиска дублей

Головачев Дмитрий Александрович

27 декабря 2016 06:35

Здравствуйте, хотел написать свое правило поиска дублей для контактов пример того как сделать взял с академии но во время выполнения скрипта появляется ошибка что переменная @parsedConfig имеет недопустимый тип данных. и еще в таблице ContactDuplicateSearchResult нету поля SysAdminUnitId вместо него идет поле GroupHash. Как изменить скрипт чтобы он заработал? bpm 7.8.0

-- Проверка наличия хранимой процедуры с именем tsp_FindContactDuplicateByNameAndContragent.

IF NOT OBJECT_ID('[dbo].[tsp_FindContactDuplicateByNameAndContragent]') IS NULL

BEGIN

    -- Удаление хранимой процедуры.

    DROP PROCEDURE [dbo].[tsp_FindContactDuplicateByNameAndContragent];

END;

GO

-- Создание хранимой процедуры.

CREATE PROCEDURE [dbo].[tsp_FindContactDuplicateByNameAndContragent] (

    -- Этот табличный параметр передается только в случае сохранения нового контакта.

    -- Содержит данные нового контакта.

    -- В случае запуска процесса глобального поиска дублей переданный параметр не содержит данных.

    @parsedConfig CreatingObjectInfo READONLY,

    -- Уникальный идентификатор пользователя, который запустил поиск дублей.

    @sysAdminUnit UNIQUEIDENTIFIER,

    -- Идентификатор текущего правила из таблицы [ContactDuplicateSearchResult].

    -- Этот идентификатор создается после регистрации правила в системе.

    @ruleId UNIQUEIDENTIFIER

)

AS

BEGIN

    -- Получение количества записей из принимаемой таблицы для определения запуска глобального поиска дублей.

    DECLARE @parsedConfigRowsCount INT = (SELECT COUNT(*) FROM @parsedConfig);

    -- Создание временной таблицы с данными контактов для поиска.

    CREATE TABLE #searchContact (

        [Name] nvarchar(250),

                [AccountId] uniqueidentifier,

        [SortDate] DATETIME

    );

    -- В случае глобального поиска выполняется заполнение временной таблицы данными.

    IF @parsedConfigRowsCount = 0

    BEGIN

        -- Добавление во временную таблицу данных для поиска дублей.

        INSERT INTO #searchContact ([Name], [AccountId],[SortDate])

        -- Запрос на выборку данных контактов.

        SELECT

            -- Выбираются колонки ИНН даты модификации контакта.

            [Name],[AccountId],

            MAX([ModifiedOn])

        FROM [Contact]

        -- Добавляется группировка по полям для возможности использовать проверку на количество.

        GROUP BY [Name],[AccountId]

        -- Таблица заполняется только в случае наличия более одного контакта.

        HAVING COUNT(*) > 1;

    END;

    -- Заполнение таблицы результатов.

    INSERT INTO [ContactDuplicateSearchResult] ([ContactId], [GroupId], [RuleId], [SysAdminUnitId])

    SELECT

        -- Идентификатор дубля контакта.

        [vr].[Id],

        -- Формирование номера группы.

        DENSE_RANK() OVER (ORDER BY [vr].[SortDate] DESC, [vr].[Name],[vr].[AccountId]),

        -- Идентификатор правила.

        @ruleId RuleId,

        -- Идентификатор пользователя, под которым запущен процесс поиска дублей.

        @sysAdminUnit

    FROM (

        -- Подзапрос, из которого заполняется таблица дублей.

        SELECT

            -- Идентификатор контакта.

            [v].[Id],

            --ФИО контакта.

            [v].[Name],

           --ИД контрагента.

            [v].[AccountId],

            -- Дата сортировки.

            [r].[SortDate]

        -- Таблицы, из которых берутся данные.

        FROM [Contact] [v], #searchContact r

        -- Правило, по которому определяется, что контакты — дубли.

        WHERE [v].[Name] = [r].[Name] AND [v].[AccountId] = [r].[AccountId] 

        -- Группировка результата поиска.

        GROUP BY [v].[Name],[v].[AccountId], [r].[SortDate], [v].[Id]

    ) [vr];

END;

GO

Нравится

3 комментария

Лапшин Павел Александрович

27 декабря 2016 14:54

Здравствуйте, я новичок в системе. Но насколько, я понял, статья https://academy.terrasoft.ru/documents/technic-sdk/7-8/dobavlenie-pravi… с примером справедлива для bpm 7.8.3 и выше... В версии 7.8.0 в таблице DuplicatesRule нет поля "Название процедуры"... Поэтому непонятно, как будет происходить вызов вновь созданной процедуры в 7.8.0, если только изменить DeduplicationSearch...

Ответить

Максим Шевченко

27 декабря 2016 17:53

Здравствуйте,
Правила дедупликации расположены в таблице [DuplicatesRule]
Там же в колонке [ProcedureName] указаны имена хранимых процедур, ответственных за обработку.
Почитайте код любой из данных процедур и напишите свой по аналогии.
К примеру, во вложении, код процедуры [tsp_FindAccountDuplicateByWeb]

new_text_document.txt

Ответить